Las palabras textuales con las que la Real Academia Española (RAE) define el término “discapacidad” son: “Situación de la persona que por sus condiciones físicas o mentales duraderas se enfrenta con notables barreras de acceso a su participación social”. Sin embargo, ¿el entorno supone aún más barreras para las personas discapacitadas? En este trabajo pretendemos responder a esta pregunta y muchas otras relacionadas, porque sospechamos que el contexto que rodea a un individuo discapacitado está íntimamente relacionado con la aparición de dicha minusvalía y su posterior desarrollo.
En primer lugar, sabemos que está demostrado que el entorno en el que vivimos afecta directamente en la manera cómo percibimos la sociedad y cómo interactuamos con ella. Precisamente, nos interesa analizar este último punto porque las personas con las que se relacione un individuo, los alimentos que ingiera, o, simplemente, las acciones que lleve a cabo pueden afectar a su salud; y, por tanto, ser causa de que aparezca una discapacidad. Incluso, si nos adentramos aún más, las características del lugar donde vive un sujeto, las cuales son inamovibles, también pueden influir en la probabilidad de padecer una minusvalía, por ejemplo, la contaminación.
Por otro lado, queremos comprobar hasta qué punto limita a un discapacitado vivir en un lugar u otro. En concreto, vamos a comparar las diferencias entre las facilidades que aporta el medio urbano y el medio rural. Normalmente la tranquilidad presente en los pueblos, por su cercanía con la naturaleza, es algo satisfactorio para el estado psicológico de los minusválidos; sin embargo, las ciudades presentan disponibles muchos más servicios clínicos que ayudan a tratar la patología.
Finalmente, nos interesa conocer no sólo los datos estadísticos que den respuesta a nuestras cuestiones, sino también las opiniones de individuos discapacitados que hayan padecido en sus propias carnes estos dilemas y puedan ser realistas exponiendo cómo se sienten. Así podremos analizar los cambios sociales y administrativos que se necesitan en este ámbito dando voz a este sector en ocasiones ignorado.
Teniendo en cuenta las secciones que trataremos, previamente descritas en la introducción, vamos a enumerar los objetivos del trabajo.
Conocer cuáles son las causas más comunes de que aparezca una discapacidad.
Analizar qué causas están relacionadas con el entorno en el que habita el discapacitado.
Estudiar el efecto que tiene la contaminación en la aparición de ciertas minusvalías.
Analizar el efecto que tiene la densidad demográfica y el ajetreo del medio urbano en la aparición de ciertas minusvalías.
Comparar las características del medio rural y el medio urbano, y determinar qué ámbito es mejor para prevenir la aparición de minusvalías.
Analizar el nivel de satisfacción de la sociedad con el entorno en que vive.
Estudiar el grado de minusvalía y autonomía personal de la mayor parte de los discapacitados.
Estudiar el nivel de integración social de los minusválidos en la sociedad actual.
Analizar los medios clínicos disponibles para los discapacitados en los pueblos y en las ciudades.
Analizar los problemas económicos discapacitados y las características de sus cuidadores.
Determinar si la calidad de vida del medio rural mejora la progresión de una discapacidad.
Reflexionar sobre la relación que existe entre la discapacidad y el entorno en el que vive el discapacitado.
El formato de todos los sets de datos con los que vamos a trabajar tienen la extensión “.xlsx” que es la extensión propia de Excel.
Todos los datos los hemos cogido de páginas oficiales como la página del Instituto Nacional de Estadística y la página de datos del Gobierno de España.
Los ficheros que vamos a trabajar son:
El tratamiento de datos lo llevaremos a cabo a través de gráficas y funciones estadísticas tales como mean(), sd(),median() o summary()
Antes de emprender el desarrollo del trabajo queremos hacer una aclaración con respecto a la terminología que vamos a emplear a continuación. Aunque comprobaréis que hemos utilizado continuamente la palabra “discapacitados”; desde nuestra posición, queremos unirnos a la campaña iniciada por la Convención Internacional por los Derechos de las Personas con Discapacidad de Naciones Unidas (ONU) donde se ha dispuesto que el término adecuado para tratar a este grupo de la población es Personas en Situación de Discapacidad.
Actualmente se ha determinado que la discapacidad es una cuestión de Derechos Humanos y no solo de salud o rehabilitación. Así que creemos que es preferible nombrar a estos individuos desde una visión positiva para no caer en eufemismos. Al fin y al cabo una persona con discapacidad NO es un individuo incapacitado, simplemente existen barreras en el entorno que dificultan su vida cotidiana. Cualquiera de nosotros puede tener otros problemas que no han sido típicamente etiquetados como “discapacidad” pero que implican impedimentos diariamente.
Así que aunque hemos empleado la palabra “discapacitados” por comodidad, no estamos del todo de acuerdo con su connotación, porque no debemos olvidar que nadie es más válido que otra persona.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Demografia <- read_excel("DATA/Demografia.xlsx")
View(Demografia)
2. Vamos a comprobar algunas medidas estadísticas con la información recogidos en la columna “PM10”.
dim(Demografia)
## [1] 19 2
class(Demografia)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 2 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(Demografia)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c..24.92....11.84....20.34....21.33....23.75....21.85....15.22....24.23....24.65....20.3....12.08....21.27....18.02....26.44....15....16.260000000000002....23....18........"
Demografia$PM10
## [1] "24.92" "11.84" "20.34"
## [4] "21.33" "23.75" "21.85"
## [7] "15.22" "24.23" "24.65"
## [10] "20.3" "12.08" "21.27"
## [13] "18.02" "26.44" "15"
## [16] "16.260000000000002" "23" "18"
## [19] ".."
is.double(Demografia$PM10)
## [1] FALSE
typeof(Demografia$PM10)
## [1] "character"
Demografia <- dplyr::rename(.data = Demografia, Comunidad = `Total*`)
Demografia
## # A tibble: 19 x 2
## Comunidad PM10
## <chr> <chr>
## 1 Andalucía 24.92
## 2 Aragón 11.84
## 3 Asturias, Principado de 20.34
## 4 Balears, Illes 21.33
## 5 Canarias 23.75
## 6 Cantabria 21.85
## 7 Castilla y León 15.22
## 8 Castilla - La Mancha 24.23
## 9 Cataluña 24.65
## 10 Comunitat Valenciana 20.3
## 11 Extremadura 12.08
## 12 Galicia 21.27
## 13 Madrid, Comunidad de 18.02
## 14 Murcia, Región de 26.44
## 15 Navarra, Comunidad Foral de 15
## 16 País Vasco 16.260000000000002
## 17 Rioja, La 23
## 18 Ceuta 18
## 19 Melilla ..
as.double(Demografia$PM10)
## Warning: NAs introducidos por coerción
## [1] 24.92 11.84 20.34 21.33 23.75 21.85 15.22 24.23 24.65 20.30 12.08 21.27
## [13] 18.02 26.44 15.00 16.26 23.00 18.00 NA
typeof(as.double(Demografia$PM10))
## Warning in typeof(as.double(Demografia$PM10)): NAs introducidos por coerción
## [1] "double"
Los datos de la columna “PM10” son de tipo “character”, necesitamos convertirlos a tipo numérico “double” para poder aplicar las funciones estadísticas.
También tendremos que tener en cuenta que el dato demográfico para “Melilla” es desconocido “NA”.
mean(as.double(Demografia$PM10), na.rm = TRUE)
## Warning in mean(as.double(Demografia$PM10), na.rm = TRUE): NAs introducidos por
## coerción
## [1] 19.91667
La media de los datos demográficos es 19.91667.
median(as.double(Demografia$PM10), na.rm = TRUE)
## Warning in median(as.double(Demografia$PM10), na.rm = TRUE): NAs introducidos
## por coerción
## [1] 20.805
La mediana de los datos demográficos es de 20.805, no se distancia mucho de la media, por lo que no habrá datos muy extremos, aunque si intuimos una diferencia importante entre la demografía de las distintas comunidades.
Demografia$Comunidad[Demografia$PM10 == min(as.double(Demografia$PM10), na.rm = TRUE)]
## Warning: NAs introducidos por coerción
## [1] "Aragón"
La comunidad autónoma española con menor dato demográfico es Aragón, con 11.84.
Demografia$Comunidad[Demografia$PM10 == max(as.double(Demografia$PM10), na.rm = TRUE)]
## Warning: NAs introducidos por coerción
## [1] "Murcia, Región de"
La comunidad autónoma con mayor dato demográfico es Murcia, con 26.44.
summary(as.double(Demografia$PM10), na.rm = TRUE)
## Warning in summary(as.double(Demografia$PM10), na.rm = TRUE): NAs introducidos
## por coerción
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 11.84 16.70 20.80 19.92 23.56 26.44 1
El mínimo es: 11.84
El máximo es: 26.44
El primer cuartil es: 16.70
El tercer cuartil es: 23.56
La media es: 19.92
Antes de comenzar a graficar hay que tener instalado el paquete básico Tidyverse.
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.4 v dplyr 1.0.7
## v tidyr 1.1.4 v stringr 1.4.0
## v readr 2.0.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(ggplot2)
ggplot(data = Demografia, aes(x = `Comunidad`, y = `PM10`)) + geom_bar(stat="identity", position="stack", fill="blue", show.legend = TRUE) + ggtitle("Demografía")+ theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Nos interesa conocer la demografía de cada comunidad autónoma porque sabemos que coincide que las zonas con menor población son aquellas que están menos industrializadas y presentan mayor ambiente rural. Como nuestro estudio pretende comparar la relación entre los pueblos y las discapacidades y la relación entre las ciudades y las discapacidades, con el set de datos que acabamos de analizar podremos definir qué regiones son más características de cada ámbito.
Por un lado hemos comprobado que la comunidad con menor proporción demográfica es Aragón, una de las comunidades más motañosas de España por los Pirineos y con gran cantidad de pueblos pequeños. En la gráfica podemos apreciar que el segundo y tercer puesto pertenecerían a Castilla y León y Extremadura, respectivamente. Ambas comunidades están poco industrializadas comparado con otras más paqueñas en extensión, y además Castilla y León es la que se encuentra a la cabeza en cuanto al número de pueblos.
Por otro lado, la comunidad con mayor proporción demográfica Murcia ya que está muy masificada y además es pequeña en extensión. Siguiendo los datos de la gráfica vemos que otras comunidades con altos valores demográficos serían Andalucia o Cataluña.
Para cerciorarnos de las conclusiones extraídas, vamos a comprobar cuántos pueblos presenta cada comunidad autónoma con un set de datos extraído del Instituto Nacional de Estadística.
library(readxl)
Pueblos <- read_excel("DATA/Pueblos.xlsx")
View(Pueblos)
dim(Pueblos)
## [1] 18 2
class(Pueblos)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 17 filas y 2 columnas, esto es así porque España se compone de 17 comunidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
Pueblos <- dplyr::rename(.data = Pueblos, Comunidad = `Comunidades Autónomas`)
Pueblos
## # A tibble: 18 x 2
## Comunidad `Número de municipios`
## <chr> <dbl>
## 1 <NA> NA
## 2 Andalucía 785
## 3 Aragón 731
## 4 Asturias, Principado de 78
## 5 Balears, Illes 67
## 6 Canarias 88
## 7 Cantabria 102
## 8 Castilla y León 2248
## 9 Castilla - La Mancha 919
## 10 Cataluña 947
## 11 Comunitat Valenciana 542
## 12 Extremadura 388
## 13 Galicia 313
## 14 Madrid, Comunidad de 179
## 15 Murcia, Región de 45
## 16 Navarra, Comunidad Foral de 272
## 17 País Vasco 251
## 18 Rioja, La 174
Pueblos <- Pueblos[-1,]
Pueblos
## # A tibble: 17 x 2
## Comunidad `Número de municipios`
## <chr> <dbl>
## 1 Andalucía 785
## 2 Aragón 731
## 3 Asturias, Principado de 78
## 4 Balears, Illes 67
## 5 Canarias 88
## 6 Cantabria 102
## 7 Castilla y León 2248
## 8 Castilla - La Mancha 919
## 9 Cataluña 947
## 10 Comunitat Valenciana 542
## 11 Extremadura 388
## 12 Galicia 313
## 13 Madrid, Comunidad de 179
## 14 Murcia, Región de 45
## 15 Navarra, Comunidad Foral de 272
## 16 País Vasco 251
## 17 Rioja, La 174
make.names(Pueblos)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La.."
## [2] "c.785..731..78..67..88..102..2248..919..947..542..388..313..179..45..272..251..174."
Pueblos[,2]
## # A tibble: 17 x 1
## `Número de municipios`
## <dbl>
## 1 785
## 2 731
## 3 78
## 4 67
## 5 88
## 6 102
## 7 2248
## 8 919
## 9 947
## 10 542
## 11 388
## 12 313
## 13 179
## 14 45
## 15 272
## 16 251
## 17 174
typeof(Pueblos$`Número de municipios`)
## [1] "double"
typeof(Pueblos$`Número de municipios`)
## [1] "double"
summary(as.integer(Pueblos$`Número de municipios`), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 45.0 102.0 272.0 478.2 731.0 2248.0
ggplot(data = Pueblos, aes(x = `Comunidad`, y = `Número de municipios`)) + geom_bar(stat="identity", position="stack", fill="green", show.legend = TRUE) + ggtitle("Número de pueblos")+ theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con los resultados obtenidos comprobamos que, efectivamente, Castilla León es la comunidad con más cantidad de pueblos con una amplia diferencia. Además, resulta sorprendente ver como otras comunidades que estaban muy pobladas tienen un número muy reducido de pueblos, tales como Madrid o Murcia. Andalucia y Cataluña vemos que tienen una amplio ámbito rural aunque también poseen muchas ciudades industrializadas, así que no vamos a fijarnos en sus características de forma significativa. De hecho las comunidades en las que mayor hincapié vamos a hacer debido a ser ejemplos muy significativos de los dos entornos que nos interesan son:
Zona rural: Castilla y León y Aragón.
Zona urbana: Murcia y Madrid.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Contaminacion <- read_excel("DATA/Contaminacion.xlsx")
View(Contaminacion)
2. Vamos a comprobar algunas medidas estadísticas con la información recogidos en la columna “Contaminación”.
dim(Contaminacion)
## [1] 19 2
class(Contaminacion)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 2 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(Contaminacion)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.10.1..5.9..15.5..19.7..9.2..5.6..4.3..1.8..10.6..6.9..4..2..18.5..9.4..9.3..10.4..6.7..6.2..21.1."
Contaminacion$`Contaminación`
## [1] 10.1 5.9 15.5 19.7 9.2 5.6 4.3 1.8 10.6 6.9 4.0 2.0 18.5 9.4 9.3
## [16] 10.4 6.7 6.2 21.1
is.double(Contaminacion$`Contaminación`)
## [1] TRUE
mean(as.double(Contaminacion$`Contaminación`), na.rm = TRUE)
## [1] 9.326316
La media de los datos de contaminación es 9.32.
median(as.double(Contaminacion$`Contaminación`), na.rm = TRUE)
## [1] 9.2
La mediana de los datos de contaminación es 9.2, al ser similar a la media sabemos que no habrá muchos valores extremos que me distorsionan la media.
Contaminacion$`Comunidad`[Contaminacion$`Contaminación` == min(as.double(Contaminacion$`Contaminación`), na.rm = TRUE)]
## [1] "Castilla - La Mancha"
La comunidad autónoma española con menos contaminación es Castilla la Mancha, con 1.8.
Contaminacion$`Comunidad`[Contaminacion$`Contaminación` == max(as.double(Contaminacion$`Contaminación`), na.rm = TRUE)]
## [1] "Melilla"
La comunidad autónoma con más contaminación es Melilla, con 21.1.
summary(as.double(Contaminacion$`Contaminación`), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.800 5.750 9.200 9.326 10.500 21.100
Análisis de las comunidades más significativas
Contaminacion$`Contaminación`[Contaminacion$`Comunidad` == "Castilla y León"]
## [1] 4.3
La contaminación en Castilla y León es bastante baja comparado con la mayoría de las comunidades, es 4.3.
Contaminacion$`Contaminación`[Contaminacion$`Comunidad` == "Aragón"]
## [1] 5.9
La contaminación en Aragón es más de tres puntos menor que la media, es 5.9.
Contaminacion$`Contaminación`[Contaminacion$`Comunidad` == "Murcia, Región de"]
## [1] 9.4
La contaminación en Murcia es algo mayor que la media, es 9.4.
Contaminacion$`Contaminación`[Contaminacion$`Comunidad` == "Madrid, Comunidad de"]
## [1] 18.5
La contaminación en Madrid es las más altas, duplica el valor de la media, es 18.5.
ggplot(data = Contaminacion, aes(x = `Comunidad`, y = `Contaminación`)) + geom_bar(stat="identity", position="stack", fill="red", show.legend = TRUE) + ggtitle("Contaminación") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Aunque no es una conclusión que se cumpla en todos los casos, vemos una clara relación entre un índice alto de contaminación y las ciudades. Históricamente siempre se han establecido las industrias más contaminantes en las zonas urbanas, así que en España podemos ver cómo aquellas comunidades que habíamos determinado como más urbanitas, y, consecuentemente, con más población, también presentan más contaminación.
Con nuestro set de datos, hemos visto que Melilla era la ciudad con más contaminación, pero debido a su situación especial no va a ser el dato más significativo para nosotras. El caso de Madrid sí que resulta esclarecedor ya que se compone principalmente de ciudades muy grandes y presenta mucha contaminación.
En el extremo opuesto, tenemos a Castilla y León que tenía el mayor número de pueblos y además, pesé a su gran extensión, también presenta índices muy bajos de contaminación. Castilla la Mancha es la comunidad con menos contaminación, y su caso es muy parecido al que acabo de mencionar. Con estos datos podemos determinar que en los pueblos hay menos contaminación que en las ciudades.
Sin embargo, ¿por qué hemos analizado la presencia de contaminación? Pues bien, la respuesta es clara, en este trabajo nos interesa describir algunas características que diferencian a los entornos que estamos comparando; y, en concreto, nos hemos centrado en parámetros que afectan a la salud humana, y, por tanto, a la aparición de ciertas discapacidades. Está comprobado por numerosas investigaciones (las cuales no vamos a incluir en este trabajo porque resultaría demasiado extenso) que la contaminación es un factor agravante de disfunciones pulmonares, desórdenes cutáneos y problemas cardíacos. De hecho se ha comprobado su relación con patologías muy incidentes que suponen la presencia de discapacidades, tales como: la diabetes la obesidad, la demencia senil, la infertilidad…
En conclusión, podemos determinar que las condiciones de contaminación de las regiones rurales son mucho más favorables para la salud que las de las ciudades. Esto también ocurre con muchos más parámetros que no analizaremos porque pretendemos quedarnos con ideas generales. Otros factores psicológicos que afectan al bienestar, y, por tanto, a la salud de las personas, serán analizados más adelante.
Para concluir con este análisis, voy a adjuntar algunas fuentes de información donde se puede profundizar sobre los efectos que tiene la contaminación en la salud humana.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Satisfacción_con_el_entorno <- read_excel("DATA/Satisfaccion.xlsx")
View(Satisfacción_con_el_entorno)
2. Vamos a comprobar algunas medidas estadísticas con la información recogidos en la columna “Satisfacción”.
dim(Satisfacción_con_el_entorno)
## [1] 19 2
class(Satisfacción_con_el_entorno)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 2 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(Satisfacción_con_el_entorno)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla.La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.7..7.6..7.7..7.6..7.1..7.6..7.4..7.4..7.2..7.2..7.3..6.6..7.1..7..7.8..7.5..7.4..6.3..6.8."
Satisfacción_con_el_entorno$Satisfacción
## [1] 7.0 7.6 7.7 7.6 7.1 7.6 7.4 7.4 7.2 7.2 7.3 6.6 7.1 7.0 7.8 7.5 7.4 6.3 6.8
is.double(Satisfacción_con_el_entorno$Satisfacción)
## [1] TRUE
typeof(Satisfacción_con_el_entorno$Satisfacción)
## [1] "double"
Los datos de la columna “Satisfacción” son de tipo “double”.
mean(as.double(Satisfacción_con_el_entorno$Satisfacción), na.rm = TRUE)
## [1] 7.242105
La media de los datos sobre individuos discapacitados es 16.38579.
median(as.double(Satisfacción_con_el_entorno$Satisfacción), na.rm = TRUE)
## [1] 7.3
La mediana de los datos demográficos es 7.2422105.
Satisfacción_con_el_entorno$`Total`[Satisfacción_con_el_entorno$Satisfacción == min(as.double(Satisfacción_con_el_entorno$Satisfacción), na.rm = TRUE)]
## [1] "Ceuta"
La comunidad autónoma española con menor satisfacion es Ceuta con 6.3.
Satisfacción_con_el_entorno$`Total`[Satisfacción_con_el_entorno$Satisfacción == max(as.double(Satisfacción_con_el_entorno$Satisfacción), na.rm = TRUE)]
## [1] "Navarra, Comunidad Foral de"
La comunidad autónoma más satisfecha es Comunidad Foral de Navarra, con 7.8.
summary(as.double(Satisfacción_con_el_entorno$Satisfacción), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 6.300 7.050 7.300 7.242 7.550 7.800
El mínimo es: 6.3
El máximo es: 7.8
El primer cuartil es: 7.05
El tercer cuartil es: 7.55
La media es: 7.242
Análisis de las comunidades más significativas
Satisfacción_con_el_entorno$`Satisfacción`[Satisfacción_con_el_entorno$`Total` == "Castilla y León"]
## [1] 7.4
La satifacción con el entrono en Castilla y León son ligeramente superiores a la media, 7.4.
Satisfacción_con_el_entorno$`Satisfacción`[Satisfacción_con_el_entorno$`Total` == "Aragón"]
## [1] 7.6
La satifacción con el entorno en Aragón son ligeramente superiores a la media, 7.6.
Satisfacción_con_el_entorno$`Satisfacción`[Satisfacción_con_el_entorno$`Total` == "Murcia, Región de"]
## [1] 7
La satifacción con el entorno en Región de Murcia, son ligeramente por debajo de la media, 7.
Satisfacción_con_el_entorno$`Satisfacción`[Satisfacción_con_el_entorno$`Total` == "Madrid, Comunidad de"]
## [1] 7.1
La satifacción con el entorno en Comunidad de Madrid son ligeramente por debajo de la media, 7.1.
Antes de comenzar a graficar hay que tener instalado el paquete básico Tidyverse.
library(tidyverse)
ggplot(data = Satisfacción_con_el_entorno, aes(x = `Total`, y = `Satisfacción`)) + geom_bar(stat="identity", position="stack", fill="purple") + ggtitle("Satisfacción con el entrono") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Basándonos en los datos Satisfacción del entorno en la vida vamos a sacar algunas conclusiones. Podemos afirmar que la comunidad más satisfecha es la Comunidad Foral de Navarra. Esto puede ser consecuencia de diversos factores, como los recursos, la economía, el clima, la sociedad… de dicha comunidad autónoma.
Por otro lado, la comunidad menos satisfecha con su entorno es Ceuta. La cual, puede deberse como en el caso anterior a diversos factores, como que es una de las ciudades autónomas más pequeñas del país.
Cuando nos hemos fijado en las comunidades más significativas o destacables, aunque no se vea una constante clara en sus cifras de satisfacción, si que hemos observado que siempre son cifras bastante cercanas al valor medio de todas las comunidades.
Finalmente, en el gráfico creado con todos los datos, se aprecia muy bien que en general la satisfacción no es muy dispar a la media. Por ello, podemos afirmar que ninguna comunidad o ciudad autónoma destaca por valores demasiado disparatados o diferenciados al resto. Con lo que podemos concluir que la satisfacción respecto del entorno en todo el país en general es bastante similar.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Discapacitados <- read_excel("DATA/Proporcion discapacitados.xlsx")
View(Discapacitados)
2. Vamos a comprobar algunas medidas estadísticas con la información recogidos en la columna “Personas con discapacidad”.
dim(Discapacitados)
## [1] 19 2
class(Discapacitados)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 2 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(Discapacitados)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.16.72..19.77..12.6..19.1..12.86..17.55..16.01..13.72..16.89..16.23..17.67..17.24..17.58..13.65..19.59..13.59..17.22..17.16..16.18."
Discapacitados$`Personas con discapacidad`
## [1] 16.72 19.77 12.60 19.10 12.86 17.55 16.01 13.72 16.89 16.23 17.67 17.24
## [13] 17.58 13.65 19.59 13.59 17.22 17.16 16.18
is.double(Discapacitados$`Personas con discapacidad`)
## [1] TRUE
typeof(Discapacitados$`Personas con discapacidad`)
## [1] "double"
Los datos de la columna “Personas con discapacidad” son de tipo “double”, así que no necesitaremos transformarlos para utilizar las funciones estadísticas.
mean(Discapacitados$`Personas con discapacidad`, na.rm = TRUE)
## [1] 16.38579
La media de los datos sobre individuos discapacitados es 16.38579.
median(Discapacitados$`Personas con discapacidad`, na.rm = TRUE)
## [1] 16.89
La mediana de los datos sobre individuos discapacitados es 16.89, al ser similar a la media podemos intuir que no habrá datos muy extremos que distorsionan la media.
Discapacitados$`Comunidades`[Discapacitados$`Personas con discapacidad` == min(Discapacitados$`Personas con discapacidad`, na.rm = TRUE)]
## [1] "Asturias, Principado de"
La comunidad autónoma española con menor dato demográfico es Asturias, con 12.60.
Discapacitados$`Comunidades`[Discapacitados$`Personas con discapacidad` == max(Discapacitados$`Personas con discapacidad`, na.rm = TRUE)]
## [1] "Aragón"
La comunidad autónoma con mayor dato demográfico es Aragón, con 19.77.
summary(Discapacitados$`Personas con discapacidad`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 12.60 14.87 16.89 16.39 17.57 19.77
El mínimo es: 12.60
El máximo es: 19.77
El primer cuartil es: 14.87
El tercer cuartil es: 17.57
La media es: 16.39
Análisis de las comunidades más significativas
Discapacitados$`Personas con discapacidad`[Discapacitados$`Comunidades`== "Castilla y León"]
## [1] 16.01
La contaminación en Castilla y León es bastante baja comparado con la mayoría de las comunidades, es 16.01.
Discapacitados$`Personas con discapacidad`[Discapacitados$`Comunidades`== "Aragón"]
## [1] 19.77
La contaminación en Aragón es más de tres puntos menor que la media, es 19.77.
Discapacitados$`Personas con discapacidad`[Discapacitados$`Comunidades`== "Murcia, Región de"]
## [1] 13.65
La contaminación en Murcia es algo mayor que la media, es 13.65.
Discapacitados$`Personas con discapacidad`[Discapacitados$`Comunidades`== "Madrid, Comunidad de"]
## [1] 17.58
La contaminación en Madrid es las más altas, duplica el valor de la media, es 17.58.
library(tidyverse)
ggplot(data = Discapacitados, aes(x = `Comunidades`, y = `Personas con discapacidad`)) + geom_bar(stat="identity", position="stack", fill="orange") + ggtitle("Proporción discapacitados") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con estos datos analizados vamos a intentar responder a la siguiente cuestión: ¿Existe mayor probabilidad de que aparezca discapacidades en ciudades que en pueblos?
Como podemos comprobar con la información estadística obtenida y el gráfico de barras representado, la comunidades con mayor proporción de personas discapacitadas es Aragón, mientras que la que menos discapacitados presenta es Asturias.
Sin embargo nosotros vamos a centrarnos en aquellas comunidades que habíamos determinado como significativas del ambiente rural y del ambiente urbano. Por un lado, como ambiente rural, tenemos a Castilla y León y Aragón que no tienen números especialmente bajos de discapacitados; de hecho, Aragón es la comunidad con mayor índice de discapacitados. Por otro lado, como ambiente urbano, tenemos representando a Murcia que tiene una proporción de discapacitados por debajo de la media, y a Madrid que tiene un índice de discapacidad algo superior a la media, pero no de los tres más altos.
Esto refleja que no hay diferencias nada significativas entre la probabilidad de que aparezcan discapacidades en los pueblos o en las ciudades. Es decir, características del entorno, como la contaminación o la densidad demográfica, no interfieren de forma transcendetal en el conjunto global de las discapacidades. Podemos intuir que esto se debe a que la mayor parte de las discapacidades tienen una implicación genética o se deben a accidentes casuales. Por si os resulta interesante vamos a adjuntar las direcciones de fuentes de información donde se analizan las principales causas de discapacidad:
Como estamos hablando del conjunto genérico de las discapacidades y no de una tipología concreta concluimos diciendo que no hay una mayor tendencia de que aparezcan discapacidades en ciudades. Si tratasemos patologías donde es muy influyente el ambiente puede que sí hubiese relación entre ambos aspectos, sin embargo, esto se incluirá como materia del trabajo.
Dicho esto, la pregunta que ahora nos concierne es: ¿existe algún tipo de relación entre el progreso de una discapacidad y en entorno en el que habita el individuo discapacitado? O sea, ¿dónde evolucionan más favorablemente las discapacidades, en las ciudades o en los pueblos?
Con el fin de caracterizar cómo son las discapacidades en nuestro país, antes de responder a la anterior pregunta planteada, vamos a tratar ciertos parámetros generales de las discapacidades. No van a ser datos muy influyentes para nuestro objetivo final pero resultan interesantes al tratar este tema. En concreto, vamos a hablar del sexo, la edad, el grado de discapacidad y la economía de la discapacidad. A continuación incluímos el artículo de una revista de la INE donde se resume toda esta información de forma muy ilustrativa.
También queremos aclarar que a partir de ahora vamos a simplificar el análisis estadístico de los sets de datos, sobre todo recurriremos al comando “summary”, para reducir el tamaño del trabajo.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
DiscSexo <- read_excel("DATA/Discapacidad por sexo.xlsx")
View(DiscSexo)
2. Vamos a comprobar algunas medidas estadísticas con la información recogidos en la columnas “Varones” y “Mujeres” por separado.
dim(DiscSexo)
## [1] 19 3
class(DiscSexo)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 3 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(DiscSexo)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.1511.3..275.2..44.3..36.9..26.3..60..14.3..103.3..71.5..203.2..193.2..42..112..177.3..53.8..17.1..68.2..6.7..3.3."
## [3] "c.2276.2..440.9..67.3..67.7..42.5..75.8..23.2..152.6..111.4..308.5..259.5..69..181..257.6..73.7..24.5..101.2..11.2..4.1."
DiscSexo$`Varones`
## [1] 1511.3 275.2 44.3 36.9 26.3 60.0 14.3 103.3 71.5 203.2
## [11] 193.2 42.0 112.0 177.3 53.8 17.1 68.2 6.7 3.3
DiscSexo$`Mujeres`
## [1] 2276.2 440.9 67.3 67.7 42.5 75.8 23.2 152.6 111.4 308.5
## [11] 259.5 69.0 181.0 257.6 73.7 24.5 101.2 11.2 4.1
is.double(DiscSexo$`Varones`)
## [1] TRUE
typeof(DiscSexo$`Varones`)
## [1] "double"
Los datos de la primera y la segunda columna son de tipo “double”, así que no necesitaremos transformarlos para utilizar las funciones estadísticas.
mean(DiscSexo$`Varones`, na.rm = TRUE)
## [1] 158.9421
mean(DiscSexo$`Mujeres`, na.rm = TRUE)
## [1] 239.3632
La media de los datos en varones es 158.94.
La media de los datos en mujeres es 239.3632.
median(DiscSexo$`Varones`, na.rm = TRUE)
## [1] 60
median(DiscSexo$`Mujeres`, na.rm = TRUE)
## [1] 75.8
La mediana para los datos en varones es 60.
La mediana para los datos en muejres es 75.8.
Las medianas son muy diferentes a las medias, eso quiere decir que hay datos muy extremos, hay mucha diferencia entre los datos de las distintas comunidades, por ello consideraremos que la media no es muy significativa.
DiscSexo$`Comunidades`[DiscSexo$`Varones` == min(DiscSexo$`Varones`, na.rm = TRUE)]
## [1] "Melilla"
DiscSexo$`Comunidades`[DiscSexo$`Mujeres` == min(DiscSexo$`Mujeres`, na.rm = TRUE)]
## [1] "Melilla"
La comunidad autónoma española con menor cantidad de varones y muejres discapacitados es Melilla.
DiscSexo$`Comunidades`[DiscSexo$`Varones` == max(DiscSexo$`Varones`, na.rm = TRUE)]
## [1] "Andalucía"
DiscSexo$`Comunidades`[DiscSexo$`Mujeres` == max(DiscSexo$`Mujeres`, na.rm = TRUE)]
## [1] "Andalucía"
La comunidad autónoma con más cantidad de hombres y mujeres discapacitados es Andalucía.
summary(DiscSexo$`Varones`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.3 31.6 60.0 158.9 144.7 1511.3
summary(DiscSexo$`Mujeres`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 4.1 54.9 75.8 239.4 219.3 2276.2
library(tidyverse)
ggplot(data = DiscSexo, aes(x = `Comunidades`, y = `Varones`)) + geom_bar(stat="identity", position="stack", fill="blue", show.legend = TRUE) + ggtitle("Varones discapacitados") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
ggplot(data = DiscSexo, aes(x = `Comunidades`, y = `Mujeres`)) + geom_bar(stat="identity", position="stack", fill="red", show.legend = TRUE) + ggtitle("Mujeres discapacitadas") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Lo primero de todo consideramos importante aclarar que en esta base de datos aparecen el número de personas discapacitadas que hay en cada caso, no son proporciones. Por ello, este set no nos sirve para ver en qué comunidad hay más cantidad de discapacitados, esa característica ya la hemos analizado anteriormente con los datos proporcionales de la cantidad de discapacitados y la densidad demográfica de cada comunidad.
Además también quiero recordar que hemos comprobado que en este caso la mediana y la media no son similares y por ello vamos a sacar conclusiones a partir de la mediana, porque hay datos muy extremos que me distorsionan la media.
Fijándonos en la mediana vemos hay más cantidad de mujeres discapacitadas que hombres, 75.8 > 60 . Si comparamos los gráficos de barras vemos que esto se aplica a todas las comunidades, y, además estos gráficos tienen la misma tendencia. Para interpretar correctamente esta información tenemos que tener en cuenta que en España durante los últimos años siempre se ha estimado que hay un millón más de mujeres que hombres. Por ejemplo, los datos del año pasado (2020) contabilizan: 24.1 millones de mujeres y 23.2 millones de hombre. Aún teniendo en cuenta esta proporción apreciamos una mayor tendencia a que alguien discapacitado sea mujer.
Para resumir, en España las causas genéricas que provocan la aparición de una discapacidad afectan más a las mujeres que a los varones.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
DiscEdad <- read_excel("DATA/Discapacidad por edad.xlsx")
## New names:
## * `` -> ...1
View(DiscEdad)
2. Vamos a comprobar algunas medidas estadísticas con la información recogidos en las columnas con distintos rangos de edad.
dim(DiscEdad)
## [1] 19 7
class(DiscEdad)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 7 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(DiscEdad)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.608.5..125.1..17.3..13.4..16.4..27.9..5.3..31.6..23.5..74.8..80.6..16.3..38..82.4..22.7..5.1..22..2.2..2.2."
## [3] "c.951.9..200.2..24.1..24.3..18..40.7..9.4..49.8..40.2..137.4..117.5..25.4..64.5..106.6..34.1..8..43.1..4.6..1.6."
## [4] "c.1201.3..233.2..31.6..33.1..17.8..40..9.1..85.9..62.4..165.6..139.7..38.1..95.6..133..41.5..13.2..52.8..4.7..2.1."
## [5] "c.482.6..78.7..19..15.2..6.6..13.6..5.5..40.6..29.5..57.7..57.3..16.1..42.3..47.8..16.3..6.3..26..2.8..0.8."
## [6] "c.339.8..51.8..11.2..11.1..5.8..7.8..5.3..29.9..17.7..47.6..36.8..10.2..32.6..39.7..8.1..5.5..15.5..2..0.6."
## [7] "c.203.4..27.2..8.2..7.4..4.2..5.7..2.9..18.2..9.6..28.6..20.8..4.9..19.9..25.3..4.8..3.4..9.9..1.8..0.2."
DiscEdad$`De 6 a 44 años`
## [1] 608.5 125.1 17.3 13.4 16.4 27.9 5.3 31.6 23.5 74.8 80.6 16.3
## [13] 38.0 82.4 22.7 5.1 22.0 2.2 2.2
is.double(DiscEdad$`De 6 a 44 años`)
## [1] TRUE
typeof(DiscEdad$`De 6 a 44 años`)
## [1] "double"
DiscEdad <- dplyr::rename(.data = DiscEdad, Comunidad =`...1`)
DiscEdad
## # A tibble: 19 x 7
## Comunidad `De 6 a 44 años` `De 45 a 64 año~ `De 65 a 79 año~ `De 80 a 84 año~
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Andalucía 608. 952. 1201. 483.
## 2 Aragón 125. 200. 233. 78.7
## 3 Asturias~ 17.3 24.1 31.6 19
## 4 Balears,~ 13.4 24.3 33.1 15.2
## 5 Canarias 16.4 18 17.8 6.6
## 6 Cantabria 27.9 40.7 40 13.6
## 7 Castilla~ 5.3 9.4 9.1 5.5
## 8 Castilla~ 31.6 49.8 85.9 40.6
## 9 Cataluña 23.5 40.2 62.4 29.5
## 10 Comunita~ 74.8 137. 166. 57.7
## 11 Extremad~ 80.6 118. 140. 57.3
## 12 Galicia 16.3 25.4 38.1 16.1
## 13 Madrid, ~ 38 64.5 95.6 42.3
## 14 Murcia, ~ 82.4 107. 133 47.8
## 15 Navarra,~ 22.7 34.1 41.5 16.3
## 16 País Vas~ 5.1 8 13.2 6.3
## 17 Rioja, La 22 43.1 52.8 26
## 18 Ceuta 2.2 4.6 4.7 2.8
## 19 Melilla 2.2 1.6 2.1 0.8
## # ... with 2 more variables: De 85 a 89 años <dbl>, Más de 90 años <dbl>
Los datos de la columnas conlos distintos rangos de edad son “double” así que no será necesario transformarlos.
Utilizamos la función “summary” para sacar todos los datos estadísticos porque al trabajar con 6 columnas sería muy extenso hacer cada estudio particular.
summary(DiscEdad, na.rm = TRUE)
## Comunidad De 6 a 44 años De 45 a 64 años De 65 a 79 años
## Length:19 Min. : 2.20 Min. : 1.60 Min. : 2.1
## Class :character 1st Qu.: 14.85 1st Qu.: 21.05 1st Qu.: 24.7
## Mode :character Median : 22.70 Median : 40.20 Median : 41.5
## Mean : 63.96 Mean :100.07 Mean : 126.4
## 3rd Qu.: 56.40 3rd Qu.: 85.55 3rd Qu.: 114.3
## Max. :608.50 Max. :951.90 Max. :1201.3
## De 80 a 84 años De 85 a 89 años Más de 90 años
## Min. : 0.80 Min. : 0.60 Min. : 0.20
## 1st Qu.: 10.10 1st Qu.: 6.80 1st Qu.: 4.50
## Median : 19.00 Median : 11.20 Median : 8.20
## Mean : 50.77 Mean : 35.74 Mean : 21.39
## 3rd Qu.: 45.05 3rd Qu.: 34.70 3rd Qu.: 20.35
## Max. :482.60 Max. :339.80 Max. :203.40
El menor mínimo corresponde al grupo de la séptima columna con 0.20.
El mayor máximo corresponde al grupo de la cuarta columna con 1201.3.
En todos las columnas podemos apreciar que la media y la mediana son muy diferentes, lo que refleja que habrá valores extremos en alguna comunidad que distorsionan el significado de la media. Por ello analizaremos la mediana.
Las mayores medianas corresponden a la tercera y cuarto columna con 40.20 y 41.5 respectivamente.
library(tidyverse)
ggplot(data = DiscEdad, aes(x = Comunidad, y = `De 6 a 44 años`)) + geom_bar(stat="identity", position="stack", fill="orange", show.legend = TRUE) + ggtitle("De 6 a 44 años") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
ggplot(data = DiscEdad, aes(x = Comunidad, y = `De 45 a 64 años`)) + geom_bar(stat="identity", position="stack", fill="blue", show.legend = TRUE) + ggtitle("De 45 a 64 años") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
ggplot(data = DiscEdad, aes(x = Comunidad, y = `De 65 a 79 años`)) + geom_bar(stat="identity", position="stack", fill="yellow", show.legend = TRUE) + ggtitle("De 65 a 79 años") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
ggplot(data = DiscEdad, aes(x = Comunidad, y = `De 80 a 84 años`)) + geom_bar(stat="identity", position="stack", fill="red", show.legend = TRUE) + ggtitle("De 80 a 84 años") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
ggplot(data = DiscEdad, aes(x = Comunidad, y = `De 85 a 89 años`)) + geom_bar(stat="identity", position="stack", fill="pink", show.legend = TRUE) + ggtitle("De 85 a 89 año") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
ggplot(data = DiscEdad, aes(x = Comunidad, y = `Más de 90 años`)) + geom_bar(stat="identity", position="stack", fill="purple", show.legend = TRUE) + ggtitle("Más de 90 años") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Lo primero de todo es necesario aclarar que los datos reflejan la cantidad total de discapacitados por edades en cada comunidad, no trabajan con proporciones en función de la densidad demográfica de cada comunidad. Por eso como Andalucia es la comunidad más poblada aparece como máximo en todos los rangos de edad. También tenemos que tener en cuenta que todos los rangos de edad no representan a la misma cantidad de personas, como sabemos el mayor groso de la población se encuentra entre los 35 y 45 años. Este último aspecto lo tendremos en cuenta para sacar nuestras conclusiones. A continuación apreciamos un gráfico donde se analiza la densidad de la población en función de la edad.
En este caso no nos interesa conocer que ocurre en cada comunidad particularmente, lo que vamos a hacer es sacar conclusiones de los valores medio de cada grupo de edad. Los individuos entre 65 y 79 años reflejan el mayo indice de discapacitados, y además no son el grupo mayoritario en la sociedad. Así que podemos inferir que en estas edades hay mayor proporción de individuos, probablemente se debe al envejecimiento de este sector. Alrededor de esas edades pueden aparecer enfermedades como: cáncer, ictus, parkinson, alzheimer…
Por otro lado, vemos que el grupo de personas entre 45 y 65 años también presentan un alto índice de discapacidos, esto se debe a que son el grupo más abundante y además también existen numerosas enfermedades que afectan a los adultos.
Sorprende ver un índice relativamente alto en el sector más juvenil, y, aunque hay que tener en cuenta que este grupo abarca muchas edades, esto puede reflejar muchas discapacidades se originan por accidentes muy frecuentes en jóvenes. De hecho, en un artículo de divulgación científica se relata lo siguiente: “De los 3,8 millones de dependientes en España, un total de 86.000 personas presentan alguna discapacidad provocada por accidentes domésticos o de ocio, cifra superior a los discapacitados por causa de accidentes de tráfico, aproximadamente 66.000 personas, según ha concluido un estudio de la Universitat de Barcelona presentado este martes.”
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Discapacidad_y_Autonomia_personal <- read_excel("DATA/Discapacidad y Autonomia personal.xlsx")
View(Discapacidad_y_Autonomia_personal)
2. Vamos a comprobar algunas medidas estadísticas de las diferentes columnas del set.
dim(Discapacidad_y_Autonomia_personal)
## [1] 19 14
class(Discapacidad_y_Autonomia_personal)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 14 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(Discapacidad_y_Autonomia_personal)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.0.782..0.7412..0.7932..0.7309..0.8366..0.6724..0.6946..0.8354..0.7066..0.7525..0.796..0.8564..0.7431..0.6889..0.7704..0.8341..0.5179..0.4891..0.7927."
## [3] "c.0.782..0.7412..0.7932..0.7309..0.8366..0.6724..0.6946..0.8354..0.7066..0.7525..0.796..0.8564..0.7431..0.6889..0.7704..0.8341..0.5179..0.4891..0.7927."
## [4] "c.0.3852..0.2823..0.3326..0.2817..0.3153..0.3049..0.2662..0.2852..0.2981..0.3667..0.3401..0.4248..0.3116..0.3702..0.2455..0.2341..0.1721..0.0711..0.4554."
## [5] "c.0.0728..0.0591..0.052..0.0685..0.063..0.0626..0.0488..0.0606..0.0615..0.0737..0.0567..0.0667..0.0438..0.057..0.043..0.0568..0.0519..0.1015..0.1031."
## [6] "c.0.0482..0.0415..0.0365..0.0625..0.0478..0.0449..0.0333..0.0351..0.0477..0.0553..0.0437..0.0552..0.0194..0.0376..0.0324..0.0373..0.0305..0.0654..0.0684."
## [7] "c.0.0491..0.0342..0.0444..0.0542..0.0376..0.0379..0.0298..0.0352..0.0472..0.0424..0.042..0.0458..0.027..0.0385..0.0324..0.0289..0.0355..0.065..0.0366."
## [8] "c.0.048..0.0402..0.0395..0.0502..0.0384..0.0335..0.0296..0.0334..0.0462..0.0517..0.0377..0.0523..0.0257..0.0379..0.0163..0.0378..0.0419..0.0682..0.0608."
## [9] "c.0.0439..0.0432..0.0215..0.0439..0.0305..0.0435..0.0251..0.0304..0.0389..0.0466..0.0342..0.0436..0.0255..0.0353..0.0181..0.0423..0.033..0.0561..0.0742."
## [10] "c.0.0241..0.0135..0.0179..0.034..0.0169..0.0311..0.0143..0.0157..0.0236..0.0259..0.0206..0.0349..0.0135..0.0081..0.0067..0.0167..0.0188..0.0261..0.0117."
## [11] "c.0.0319..0.0264..0.0233..0.0414..0.0322..0.0284..0.016..0.022..0.0327..0.0322..0.0259..0.0386..0.02..0.0339..0.0126..0.031..0.0384..0.029..0.0429."
## [12] "c.0.0162..0.0055..0.0066..0.0137..0.0131..0.0103..0.0094..0.0208..0.0136..0.0151..0.0054..0.0092..0.0091..0.0161..0.0102..0.0106..0.0084..0.0151..0.0242."
## [13] "c.0.0131..0.008..0.0055..0.0029..0.0055..0.0035..0.0159..0.0098..0.0096..0.0122..0.0201..0.0133..0.0085..0.0075..0.0178..0.0117..0.0073..0.0229..0.0176."
## [14] "c.0.0252..0.0262..0.0129..0.0334..0.0211..0.0241..0.0182..0.0162..0.0144..0.0266..0.0287..0.0365..0.0106..0.023..0.0074..0.0148..0.0102..0.0044..0.0612."
Discapacidad_y_Autonomia_personal$`Supervivencia a la edad`
## [1] 0.7820 0.7412 0.7932 0.7309 0.8366 0.6724 0.6946 0.8354 0.7066 0.7525
## [11] 0.7960 0.8564 0.7431 0.6889 0.7704 0.8341 0.5179 0.4891 0.7927
is.double(Discapacidad_y_Autonomia_personal$`Supervivencia a la edad`)
## [1] TRUE
typeof(Discapacidad_y_Autonomia_personal$`Supervivencia a la edad`)
## [1] "double"
Los datos de todas las columnas son de tipo “double”.
summary(Discapacidad_y_Autonomia_personal, na.rm = TRUE)
## Comunidad Supervivencia a la edad Tasa de enfermedad crónica
## Length:19 Min. :0.4891 Min. :0.4891
## Class :character 1st Qu.:0.7006 1st Qu.:0.7006
## Mode :character Median :0.7525 Median :0.7525
## Mean :0.7386 Mean :0.7386
## 3rd Qu.:0.7946 3rd Qu.:0.7946
## Max. :0.8564 Max. :0.8564
## Tasa de mala salud percibida Tasa de discapacidad Tasa de discapacidad severa
## Min. :0.0711 Min. :0.04300 Min. :0.01940
## 1st Qu.:0.2740 1st Qu.:0.05435 1st Qu.:0.03580
## Median :0.3049 Median :0.06060 Median :0.04370
## Mean :0.3023 Mean :0.06332 Mean :0.04435
## 3rd Qu.:0.3534 3rd Qu.:0.06760 3rd Qu.:0.05170
## Max. :0.4554 Max. :0.10310 Max. :0.06840
## Tasa de discapacidad de los que necesitan ayudas
## Min. :0.02700
## 1st Qu.:0.03470
## Median :0.03790
## Mean :0.04019
## 3rd Qu.:0.04510
## Max. :0.06500
## Tasa de discapacidad para las actividades básicas de la vida diaria
## Min. :0.01630
## 1st Qu.:0.03560
## Median :0.03950
## Mean :0.04154
## 3rd Qu.:0.04910
## Max. :0.06820
## Tasa de discapacidad de movilidad Tasa de discapacidad de autocuidado
## Min. :0.01810 Min. :0.00670
## 1st Qu.:0.03045 1st Qu.:0.01390
## Median :0.03890 Median :0.01790
## Mean :0.03841 Mean :0.01969
## 3rd Qu.:0.04375 3rd Qu.:0.02500
## Max. :0.07420 Max. :0.03490
## Tasa de discapacidad para realizar las tareas del hogar
## Min. :0.01260
## 1st Qu.:0.02460
## Median :0.03100
## Mean :0.02941
## 3rd Qu.:0.03330
## Max. :0.04290
## Tasa de discapacidad de visión Tasa de discapacidad de audición
## Min. :0.00540 Min. :0.00290
## 1st Qu.:0.00915 1st Qu.:0.00740
## Median :0.01060 Median :0.00980
## Mean :0.01224 Mean :0.01119
## 3rd Qu.:0.01510 3rd Qu.:0.01460
## Max. :0.02420 Max. :0.02290
## Tasa de discapacidad de deficiencias osteoarticulares
## Min. :0.00440
## 1st Qu.:0.01365
## Median :0.02110
## Mean :0.02185
## 3rd Qu.:0.02640
## Max. :0.06120
summary(Discapacidad_y_Autonomia_personal$`Supervivencia a la edad`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.4891 0.7006 0.7525 0.7386 0.7946 0.8564
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Supervivencia a la edad` == min(Discapacidad_y_Autonomia_personal$`Supervivencia a la edad`, na.rm = TRUE)]
## [1] "Ceuta"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Supervivencia a la edad` == max(Discapacidad_y_Autonomia_personal$`Supervivencia a la edad`, na.rm = TRUE)]
## [1] "Galicia"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Supervivencia a la edad`)) + geom_bar(stat="identity", position="stack", fill="green") + ggtitle("Esperanza de vida") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a la supervivencia a la edad, vemos que los habitantes de Galicia tienen de media la vida más longeva, mientras que en Ceuta tienen la menor esperanza de vida. Esto último puede deberse a la localización de Ceuta y al clima tan cálido que tienen que soportar. También cabe mencionar que no hay valores muy extremos, por lo que no encontramos gran diferencia en la esperanza de vida entre las distintas comunidades autónomas españolas. La supervivencia a la edad tampoco parece estar ligada de forma significativa con el ámbito rural, dado que Castilla y León (zona rural) si que presenta una alta esperanza de vida, pero Madrid (zona urbana) tiene un valor similar. Podríamos intuir que la esperanza de vida está más ligada al nivel económico y el clima de la comunidad dado que líneas generales parece que la supervivencia a la edad es mayor en el norte que en el sur de España. Como sabemos que la esperanza de vida está intimamente relacionada con la calidad de vida en el lugar que vive en un individuo, vamos a analizar la siguiente imagen:
A modo ilustrativo, también vamos a adjuntar algunos mapas donde se ve la variación de la esperanza de vida en nuestro país en las últimas décadas y cuáles son los paises con mayor tasa de supervivencia a la edad a nivel mundial.
summary(Discapacidad_y_Autonomia_personal$`Tasa de enfermedad crónica`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.4891 0.7006 0.7525 0.7386 0.7946 0.8564
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de enfermedad crónica` == min(Discapacidad_y_Autonomia_personal$`Tasa de enfermedad crónica`, na.rm = TRUE)]
## [1] "Ceuta"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de enfermedad crónica` == max(Discapacidad_y_Autonomia_personal$`Tasa de enfermedad crónica`, na.rm = TRUE)]
## [1] "Galicia"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de enfermedad crónica`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("Tasa de enfermedad crónica") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a la proporción de enfermedades crónicas, vemos que, de nuevo, los habitantes de Galicia son los que más enfermedades crónicas, mientras que los Ceuta tienen la menor proporción.
summary(Discapacidad_y_Autonomia_personal$`Tasa de mala salud percibida`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0711 0.2740 0.3049 0.3023 0.3534 0.4554
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de mala salud percibida` == min(Discapacidad_y_Autonomia_personal$`Tasa de mala salud percibida`, na.rm = TRUE)]
## [1] "Ceuta"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de mala salud percibida` == max(Discapacidad_y_Autonomia_personal$`Tasa de mala salud percibida`, na.rm = TRUE)]
## [1] "Melilla"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de mala salud percibida`)) + geom_bar(stat="identity", position="stack", fill="pink") + ggtitle("Tasa de mala salud percibida") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respectoa la tasa de mala salud percibida, Ceuta es la región con mejor salud y Melilla la que peor tasa de salud presenta. Al ser ciudades autónomas pequeñas no son muy significativas así que vamos a fijarnos en las comunidades que habíamos establecido como más significativas. Por un lado, en cuanto al ámbito rural, Castilla y León presenta níveles medios. Y, por otro lado, del ámbito urbano, Madrid tiene una tasa algo superior a la media, pero sin diferencias esclarecedoras. Así que no parece que la salud sea mejor en ámbitos rurales, aunque aún nos falta responder a: ¿la atención sanitaria es igual de satisfactorio en pueblos que en ciudades?
summary(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.04300 0.05435 0.06060 0.06332 0.06760 0.10310
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad` == min(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad`, na.rm = TRUE)]
## [1] "Navarra, Comunidad Foral de"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad` == max(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad`, na.rm = TRUE)]
## [1] "Melilla"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de discapacidad`)) + geom_bar(stat="identity", position="stack", fill="orange") + ggtitle("Tasa de discapacidad") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Ya habíamos analizado la proporción de discapacitados por comunidad, los datos obtenidos ahora son similares, Navarra es la que mayor proporción presenta mientras que Melilla es la que menos proporción tiene. Vamos a comparar exactamente los valores de ambos sets con un join, aunque hay que tener en cuenta que la proporción no se calcula de la misma manera.
Discapacitados %>%
full_join(x = ., y = Discapacidad_y_Autonomia_personal %>%
select(`Comunidad`, `Tasa de discapacidad`),
by = c("Comunidades" = "Comunidad"))
## # A tibble: 19 x 3
## Comunidades `Personas con discapacidad` `Tasa de discapacida~
## <chr> <dbl> <dbl>
## 1 Andalucía 16.7 0.0728
## 2 Aragón 19.8 0.0591
## 3 Asturias, Principado de 12.6 0.052
## 4 Balears, Illes 19.1 0.0685
## 5 Canarias 12.9 0.063
## 6 Cantabria 17.6 0.0626
## 7 Castilla y León 16.0 0.0488
## 8 Castilla - La Mancha 13.7 0.0606
## 9 Cataluña 16.9 0.0615
## 10 Comunitat Valenciana 16.2 0.0737
## 11 Extremadura 17.7 0.0567
## 12 Galicia 17.2 0.0667
## 13 Madrid, Comunidad de 17.6 0.0438
## 14 Murcia, Región de 13.6 0.057
## 15 Navarra, Comunidad Foral de 19.6 0.043
## 16 País Vasco 13.6 0.0568
## 17 Rioja, La 17.2 0.0519
## 18 Ceuta 17.2 0.102
## 19 Melilla 16.2 0.103
summary(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad severa`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.01940 0.03580 0.04370 0.04435 0.05170 0.06840
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad severa` == min(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad severa`, na.rm = TRUE)]
## [1] "Madrid, Comunidad de"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad severa` == max(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad severa`, na.rm = TRUE)]
## [1] "Melilla"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de discapacidad severa`)) + geom_bar(stat="identity", position="stack", fill="grey") + ggtitle("Tasa de discapacidad severa") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a la tasa de discapacidad severa, Madrid presenta el menor índice, mientras que Melilla tiene la mayor tasa de discapacitados severos.
summary(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de los que necesitan ayudas`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.02700 0.03470 0.03790 0.04019 0.04510 0.06500
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de los que necesitan ayudas` == min(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de los que necesitan ayudas`, na.rm = TRUE)]
## [1] "Madrid, Comunidad de"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de los que necesitan ayudas` == max(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de los que necesitan ayudas`, na.rm = TRUE)]
## [1] "Ceuta"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de discapacidad de los que necesitan ayudas`)) + geom_bar(stat="identity", position="stack", fill="purple") + ggtitle("Tasa de discapacidad de los que necesitan ayudas") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a tasa de discapacidad de los que necesitan ayudas, Madrid presenta el menor índice, mientras que Ceuta tiene la mayor tasa de discapacitados severos. Son resultados muy similares a los de la tasa de discapacidad severa, dado que es lógico que las personas con minusvalías más graves necesiten más ayuda. Podemos comparar mejor los valores de ambas columnas seleccionandolas.
Discapacidad_y_Autonomia_personal %>%
select(`Comunidad`, `Tasa de discapacidad severa`, `Tasa de discapacidad de los que necesitan ayudas`)
## # A tibble: 19 x 3
## Comunidad `Tasa de discapacidad severa` `Tasa de discapaci~
## <chr> <dbl> <dbl>
## 1 Andalucía 0.0482 0.0491
## 2 Aragón 0.0415 0.0342
## 3 Asturias, Principado de 0.0365 0.0444
## 4 Balears, Illes 0.0625 0.0542
## 5 Canarias 0.0478 0.0376
## 6 Cantabria 0.0449 0.0379
## 7 Castilla y León 0.0333 0.0298
## 8 Castilla - La Mancha 0.0351 0.0352
## 9 Cataluña 0.0477 0.0472
## 10 Comunitat Valenciana 0.0553 0.0424
## 11 Extremadura 0.0437 0.042
## 12 Galicia 0.0552 0.0458
## 13 Madrid, Comunidad de 0.0194 0.027
## 14 Murcia, Región de 0.0376 0.0385
## 15 Navarra, Comunidad Foral de 0.0324 0.0324
## 16 País Vasco 0.0373 0.0289
## 17 Rioja, La 0.0305 0.0355
## 18 Ceuta 0.0654 0.065
## 19 Melilla 0.0684 0.0366
summary(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad para las actividades básicas de la vida diaria`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.01630 0.03560 0.03950 0.04154 0.04910 0.06820
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad para las actividades básicas de la vida diaria` == min(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad para las actividades básicas de la vida diaria`, na.rm = TRUE)]
## [1] "Navarra, Comunidad Foral de"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad para las actividades básicas de la vida diaria` == max(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad para las actividades básicas de la vida diaria`, na.rm = TRUE)]
## [1] "Ceuta"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de discapacidad para las actividades básicas de la vida diaria`)) + geom_bar(stat="identity", position="stack", fill="white") + ggtitle("Tasa de discapacidad para las actividades básicas de la vida diaria") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a tasa de discapacidad para las actividades básicas de la vida diaria, Navarra presenta el menor índice, mientras que Ceuta tiene la mayor tasa de discapacitados. Luego analizaremos mejor qué actividades pueden verse afectadas ante una discapacidad.
summary(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de movilidad`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.01810 0.03045 0.03890 0.03841 0.04375 0.07420
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de movilidad` == min(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de movilidad`, na.rm = TRUE)]
## [1] "Navarra, Comunidad Foral de"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de movilidad` == max(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de movilidad`, na.rm = TRUE)]
## [1] "Melilla"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de discapacidad de movilidad`)) + geom_bar(stat="identity", position="stack", fill="black") + ggtitle("Tasa de discapacidad de movilidad") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a tasa de discapacidad de movilidad, Navarra presenta el menor índice, mientras que Melilla tiene la mayor tasa de discapacitados con limitación de movilidad. Los resultados son similares al resto de las columnas, pero sí que es verdad que para este atributo tenemos una media algo menor y valores más bajos en todas las columnas, eso refleja que solo una parte de los discapacitados tendrán limitada su movilidad, no son la mayoría.
summary(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de autocuidado`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00670 0.01390 0.01790 0.01969 0.02500 0.03490
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de autocuidado` == min(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de autocuidado`, na.rm = TRUE)]
## [1] "Navarra, Comunidad Foral de"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de autocuidado` == max(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de autocuidado`, na.rm = TRUE)]
## [1] "Galicia"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de discapacidad de autocuidado`)) + geom_bar(stat="identity", position="stack", fill="yellow") + ggtitle("Tasa de discapacidad de autocuidado") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a la discapacidad de autocuidado, Navarra presenta los valores más bajos, mientras que Galicia tiene la mayor tasa.
summary(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad para realizar las tareas del hogar`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.01260 0.02460 0.03100 0.02941 0.03330 0.04290
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad para realizar las tareas del hogar` == min(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad para realizar las tareas del hogar`, na.rm = TRUE)]
## [1] "Navarra, Comunidad Foral de"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad para realizar las tareas del hogar` == max(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad para realizar las tareas del hogar`, na.rm = TRUE)]
## [1] "Melilla"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de discapacidad para realizar las tareas del hogar`)) + geom_bar(stat="identity", position="stack", fill="green") + ggtitle("Tasa de discapacidad para realizar tareas del hogar") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a la discapacidad para realizar las tareas del hogar, de nuevo vemos que Navarra presenta los valores más bajos, mientras que Melilla tiene la mayor tasa.
summary(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de visión`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00540 0.00915 0.01060 0.01224 0.01510 0.02420
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de visión` == min(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de visión`, na.rm = TRUE)]
## [1] "Extremadura"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de visión` == max(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de visión`, na.rm = TRUE)]
## [1] "Melilla"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de discapacidad de visión`)) + geom_bar(stat="identity", position="stack", fill="brown") + ggtitle("Tasa de discapacidad de visión") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a la discapacidad de visión vemos que Extremadura presenta los valores más bajos, mientras que Melilla tiene la mayor tasa.
summary(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de audición`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00290 0.00740 0.00980 0.01119 0.01460 0.02290
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de audición` == min(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de audición`, na.rm = TRUE)]
## [1] "Balears, Illes"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de audición` == max(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de audición`, na.rm = TRUE)]
## [1] "Ceuta"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de discapacidad de audición`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("Tasa de discapacidad de audición") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a la discapacidad de audición vemos que las Islas Baleares presenta los valores más bajos, mientras que Ceuta tiene la mayor tasa.
summary(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de deficiencias osteoarticulares`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00440 0.01365 0.02110 0.02185 0.02640 0.06120
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de deficiencias osteoarticulares` == min(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de deficiencias osteoarticulares`, na.rm = TRUE)]
## [1] "Ceuta"
Discapacidad_y_Autonomia_personal$`Comunidad`[Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de deficiencias osteoarticulares` == max(Discapacidad_y_Autonomia_personal$`Tasa de discapacidad de deficiencias osteoarticulares`, na.rm = TRUE)]
## [1] "Melilla"
library(tidyverse)
ggplot(data = Discapacidad_y_Autonomia_personal, aes(x = `Comunidad`, y = `Tasa de discapacidad de deficiencias osteoarticulares`)) + geom_bar(stat="identity", position="stack", fill="blue") + ggtitle("Tasa de discapacidad de deficiencias osteoarticulares") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a la discapacidad de deficiencias osteoarticulares vemos que las Ceuta presenta los valores más bajos, mientras que Melilla tiene la mayor tasa.
De forma muy resumida diremos que Navarra muestra, para muchos de los atributos, la tasa más baja de discapacitados. Este dato resulta interesante porque, cuando hemos analizado la proporción de discapacidatos por comunidad, Navarra no tenían la proporción más baja. Por lógica podríamos pensar que entonces Navarra tendrá una gran calidad en su servicio sanitario y, por tanto, los individuos dispacitados presentan bastante autonomía personal, pero es algo que verificaremos más adelante. Además cabe añadir que para ningún atributo se ha apreciado un gran diferencia entre las comunidades urbanas y rurales.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Economia_discapacitados <- read_excel("DATA/Economia discapacitados.xlsx")
View(Economia_discapacitados)
2. Vamos a comprobar algunas medidas estadísticas de las diferentes columnas del set.
dim(Economia_discapacitados)
## [1] 19 10
class(Economia_discapacitados)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 10 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente que todos los nombres de las columnas cumplan las reglas sintácticas. En este caso todos los datos de dichas columnas son de tipo “double”.
summary(Economia_discapacitados, na.rm = TRUE)
## Comunidad Con dificultades para pagar las cosas esenciales
## Length:19 Min. :26.40
## Class :character 1st Qu.:36.65
## Mode :character Median :41.46
## Mean :40.16
## 3rd Qu.:43.31
## Max. :52.92
## Ingresos limitados Subida de precios Dificultades para gestionar el dinero
## Min. :20.63 Min. : 8.79 Min. :0.000
## 1st Qu.:29.94 1st Qu.:11.19 1st Qu.:0.110
## Median :34.28 Median :13.81 Median :0.420
## Mean :33.55 Mean :13.15 Mean :0.470
## 3rd Qu.:37.72 3rd Qu.:14.91 3rd Qu.:0.605
## Max. :46.16 Max. :16.82 Max. :1.840
## Costes derivados de enfermedad o problema de salud crónico
## Min. :0.000
## 1st Qu.:0.915
## Median :1.210
## Mean :1.117
## 3rd Qu.:1.380
## Max. :2.110
## Costes derivados de limitación en actividades básicas Gastos extra inesperados
## Min. :0.0000 Min. :2.320
## 1st Qu.:0.1800 1st Qu.:3.345
## Median :0.3700 Median :3.970
## Mean :0.4342 Mean :3.915
## 3rd Qu.:0.6700 3rd Qu.:4.430
## Max. :1.0500 Max. :6.010
## Situación financiera de otro miembro del hogar Otras razones
## Min. :2.250 Min. :2.640
## 1st Qu.:3.015 1st Qu.:3.755
## Median :4.360 Median :4.500
## Mean :4.165 Mean :4.765
## 3rd Qu.:5.345 3rd Qu.:5.650
## Max. :6.350 Max. :6.940
Nos centraremos en el analisis de las columnas que hemos considerado más relevantes para nuestro trabajo. En este caso serán las columnas llamadas, “Con dificultades para pagar las cosas esenciales”, “Ingresos limitados”, “Dificultades para gestionar el dinero” y “Costes derivados de enfermedad o problema de salud crónico”
summary(Economia_discapacitados$`Con dificultades para pagar las cosas esenciales`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 26.40 36.65 41.46 40.16 43.31 52.92
Economia_discapacitados$`Comunidad`[Economia_discapacitados$`Con dificultades para pagar las cosas esenciales` == min(Economia_discapacitados$`Con dificultades para pagar las cosas esenciales`, na.rm = TRUE)]
## [1] "País Vasco"
Economia_discapacitados$`Comunidad`[Economia_discapacitados$`Con dificultades para pagar las cosas esenciales` == max(Economia_discapacitados$`Con dificultades para pagar las cosas esenciales`, na.rm = TRUE)]
## [1] "Andalucía"
library(tidyverse)
ggplot(data = Economia_discapacitados, aes(x = `Comunidad`, y = `Con dificultades para pagar las cosas esenciales`)) + geom_bar(stat="identity", position="stack", fill="green") + ggtitle("Dificultades de asumir gastos esenciales") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Basándonos en los datos obtenidos con el análisis, podemos ver que la de dificultades para pagar las cosas esenciales es de un valor de 41.46 puntos. Pero al ser el mínimo 26.40 y el máximo 52.92, vemos que ambos valores no son proximos al de la media. Por ello, podemos afrimar que hay bastante variación en todo el país. Cabe destacar que los que tienen la mayor dificultad para pagar los gastos esenciales son los los habitantes de Andalucia y por otro lado lo que menos son los del País Vasco. Con esto volvemos a remarcar la diferencia significativa que hay entre el sur y el norte del país, tal y como hemos comentando en otros análisis.
summary(Economia_discapacitados$`Ingresos limitados`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 20.63 29.94 34.28 33.55 37.72 46.16
Economia_discapacitados$`Comunidad`[Economia_discapacitados$`Ingresos limitados` == min(Economia_discapacitados$`Ingresos limitados`, na.rm = TRUE)]
## [1] "País Vasco"
Economia_discapacitados$`Comunidad`[Economia_discapacitados$`Ingresos limitados` == max(Economia_discapacitados$`Ingresos limitados`, na.rm = TRUE)]
## [1] "Andalucía"
library(tidyverse)
ggplot(data = Economia_discapacitados, aes(x = `Comunidad`, y = `Ingresos limitados`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("Ingresos limitados") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
En el caso del análisis de los ingresos limitados el valor medio es de 34.28 y tiene unos máximos y mínimos bastantes alejados de la media. Pudiendo así afirmar que los valores son bastante dispares en todo el estado. En el caso de esta variable también, los discapacitados con menos ingresos son los que viven en Andalucia y los de mayor ingresos los que viven en el País Vasco. Volviendo a destacar la diferencia entre el sur y el norte del país.
summary(Economia_discapacitados$`Dificultades para gestionar el dinero`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.110 0.420 0.470 0.605 1.840
Economia_discapacitados$`Comunidad`[Economia_discapacitados$`Dificultades para gestionar el dinero` == min(Economia_discapacitados$`Dificultades para gestionar el dinero`, na.rm = TRUE)]
## [1] "Balears, Illes" "Navarra, Comunidad Foral de"
## [3] "Melilla"
Economia_discapacitados$`Comunidad`[Economia_discapacitados$`Dificultades para gestionar el dinero` == max(Economia_discapacitados$`Dificultades para gestionar el dinero`, na.rm = TRUE)]
## [1] "Asturias, Principado de"
library(tidyverse)
ggplot(data = Economia_discapacitados, aes(x = `Comunidad`, y = `Dificultades para gestionar el dinero`)) + geom_bar(stat="identity", position="stack", fill="pink")+ ggtitle("Dificultades para gestionar el dinero") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las dificultades al gestionar el dinero, obtenemos que la media es del 0.42. Y en este caso los minimos y másximos son muy dispares, sobre todo en el caso del máximo. Tiene un valor de 1.84 y corresponde al Principado de Asturias.
summary(Economia_discapacitados$`Costes derivados de enfermedad o problema de salud crónico`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.915 1.210 1.117 1.380 2.110
Economia_discapacitados$`Comunidad`[Economia_discapacitados$`Costes derivados de enfermedad o problema de salud crónico` == min(Economia_discapacitados$`Costes derivados de enfermedad o problema de salud crónico`, na.rm = TRUE)]
## [1] "Ceuta" "Melilla"
Economia_discapacitados$`Comunidad`[Economia_discapacitados$`Costes derivados de enfermedad o problema de salud crónico` == max(Economia_discapacitados$`Costes derivados de enfermedad o problema de salud crónico`, na.rm = TRUE)]
## [1] "Murcia, Región de"
library(tidyverse)
ggplot(data = Economia_discapacitados, aes(x = `Comunidad`, y = `Costes derivados de enfermedad o problema de salud crónico`)) + geom_bar(stat="identity", position="stack", fill="grey")+ ggtitle("Costes de la enfermedad") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Analizando esta última variable, que nos indica los costes que tienen que asumir por la propia enfermedad hemos obtenido que la media es de 1.117€ mensuales. Es destacable que el mínimo es de 0€, por lo que asumimos que las comunidades o ciudades autonomas de Murcia y Melilla, tanto con ayudas o subenciones asumen todo el gasto referido a su enfermedad o problema crónico, por lo que el afectado no tendrá que hacerse cargo de ellos. Por otro lado, tenemos en el máximo a la Región de Murcia con 2.110€, por lo que concluimos que se trata de la comunidad con menos ayudas económicas dirigidas a personas con discapacidad. En el gráfico se aprecia también, que exceptuando los dos extremos indicados anteriormente, la diferencia entre comunidades no es extremadamente diversa, siempre hablando de forma generalizada.
Aunque hayamos analizado variables completamente diferentes sobre algunos aspectos de la economía de una persona discapacida, podemos sacar una conclusión generalizada.
Por un lado, es clara la diferenciación a nivel económico de las personas discapacitadas dependiendo de la comunidad en la que vivan, sobre todo es bastante visible la diferencia entre las comunidades situadas al sur del país y al norte.En general las del norte tienen mejor economía y menos gastos en el caso de las personas discapacitadas (con la excepción de Ceuta y Melilla).
También es muy destacable en qué comunidades dan mayores facilidades para las personas con discapacidad a nivel financiero. Y es curioso el gran salto que hay entre comunidades de un mismo país. Teniendo en cuenta que la economía de un discapacitado es significativamente relevante para tener una mejor calidad de vida, influyendo en gran medida a su vida cotidiana.
library(readxl)
Centros_de_salud <- read_excel("DATA/Centros_de_salud.xlsx")
## New names:
## * `` -> ...1
View(Centros_de_salud)
Vamos a analizar las dimensiones de este set de datos.
dim(Centros_de_salud)
## [1] 18 5
Este set de datos tiene 18 filas y 5 columnas con información sobre las el número de centros de salud o consultorios locales de las comunidades autónomas. Las 18 columnas se deben a que España esta formado por 17 ciudades autónomas y dos ciudades autónomas las cuales ocupan en este set de datos la misma fila.
class(Centros_de_salud)
## [1] "tbl_df" "tbl" "data.frame"
Para poder realizar el análisis de los datos vamos a transformar todos los nombres de las columnas con “make.names” para cumplan las reglas sintácticas. Vamos a realizar este proceso para las columnas “Total_de_centros”, “Centros_de_salud_por_Comunidad”, “Consultorios_locales” y “Tasa_por_100.00_habitantes”.
make.names(Centros_de_salud)
## [1] "c..Andalucía....Aragón....Asturias..Principado....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla.La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid.Comunidad.de....Murcia..Región.de....Navarra..C..Foral.de....País.Vasco....Rioja..La....Ceuta.y.Melilla.."
## [2] "c.1517..989..213..162..262..166..3916..1313..1207..852..526..465..424..265..296..322..194..7."
## [3] "c.407..118..69..58..107..42..247..203..418..285..111..398..262..85..59..155..20..7."
## [4] "c.1110..871..144..104..155..124..3669..1110..789..567..415..67..162..180..237..167..174..0."
## [5] "c.18..74.7..20.9..13.5..11.8..28.5..163..64.4..15.9..17..49.5..17.2..6.3..17.7..45.4..14.8..61.7..4.1."
Centros_de_salud$Total_de_centros
## [1] 1517 989 213 162 262 166 3916 1313 1207 852 526 465 424 265 296
## [16] 322 194 7
is.double(Centros_de_salud$Total_de_centros)
## [1] TRUE
typeof(Centros_de_salud$Total_de_centros)
## [1] "double"
make.names(Centros_de_salud)
## [1] "c..Andalucía....Aragón....Asturias..Principado....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla.La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid.Comunidad.de....Murcia..Región.de....Navarra..C..Foral.de....País.Vasco....Rioja..La....Ceuta.y.Melilla.."
## [2] "c.1517..989..213..162..262..166..3916..1313..1207..852..526..465..424..265..296..322..194..7."
## [3] "c.407..118..69..58..107..42..247..203..418..285..111..398..262..85..59..155..20..7."
## [4] "c.1110..871..144..104..155..124..3669..1110..789..567..415..67..162..180..237..167..174..0."
## [5] "c.18..74.7..20.9..13.5..11.8..28.5..163..64.4..15.9..17..49.5..17.2..6.3..17.7..45.4..14.8..61.7..4.1."
Centros_de_salud$Centros_de_salud_por_comunidad
## [1] 407 118 69 58 107 42 247 203 418 285 111 398 262 85 59 155 20 7
is.double(Centros_de_salud$Centros_de_salud_por_comunidad)
## [1] TRUE
typeof(Centros_de_salud$Centros_de_salud_por_comunidad)
## [1] "double"
make.names(Centros_de_salud)
## [1] "c..Andalucía....Aragón....Asturias..Principado....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla.La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid.Comunidad.de....Murcia..Región.de....Navarra..C..Foral.de....País.Vasco....Rioja..La....Ceuta.y.Melilla.."
## [2] "c.1517..989..213..162..262..166..3916..1313..1207..852..526..465..424..265..296..322..194..7."
## [3] "c.407..118..69..58..107..42..247..203..418..285..111..398..262..85..59..155..20..7."
## [4] "c.1110..871..144..104..155..124..3669..1110..789..567..415..67..162..180..237..167..174..0."
## [5] "c.18..74.7..20.9..13.5..11.8..28.5..163..64.4..15.9..17..49.5..17.2..6.3..17.7..45.4..14.8..61.7..4.1."
Centros_de_salud$Consultorios_locales
## [1] 1110 871 144 104 155 124 3669 1110 789 567 415 67 162 180 237
## [16] 167 174 0
is.double(Centros_de_salud$Consultorios_locales)
## [1] TRUE
typeof(Centros_de_salud$Consultorios_locales)
## [1] "double"
make.names(Centros_de_salud)
## [1] "c..Andalucía....Aragón....Asturias..Principado....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla.La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid.Comunidad.de....Murcia..Región.de....Navarra..C..Foral.de....País.Vasco....Rioja..La....Ceuta.y.Melilla.."
## [2] "c.1517..989..213..162..262..166..3916..1313..1207..852..526..465..424..265..296..322..194..7."
## [3] "c.407..118..69..58..107..42..247..203..418..285..111..398..262..85..59..155..20..7."
## [4] "c.1110..871..144..104..155..124..3669..1110..789..567..415..67..162..180..237..167..174..0."
## [5] "c.18..74.7..20.9..13.5..11.8..28.5..163..64.4..15.9..17..49.5..17.2..6.3..17.7..45.4..14.8..61.7..4.1."
Centros_de_salud$Tasa_por_100.000_habitantes
## [1] 18.0 74.7 20.9 13.5 11.8 28.5 163.0 64.4 15.9 17.0 49.5 17.2
## [13] 6.3 17.7 45.4 14.8 61.7 4.1
is.double(Centros_de_salud$Tasa_por_100.000_habitantes)
## [1] TRUE
typeof(Centros_de_salud$Tasa_por_100.000_habitantes)
## [1] "double"
Vamos a ir analizando cada columna
Columna “Total_de_centros”"
Media y mediana
mean(as.double(Centros_de_salud$Total_de_centros), na.rm = TRUE)
## [1] 727.5556
La media del número total de centros de salud por comunidad y/o ciudad autónoma es 727.5556
median(as.double(Centros_de_salud$Total_de_centros), na.rm = TRUE)
## [1] 373
La medina del número de centros de salud por comunidad y/o ciudad autónoma es 373
La mediana de los datos demográficos se distancia mucho de la media, por lo que habrá datos muy extremos.
summary(as.double(Centros_de_salud$Total_de_centros), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7.0 225.2 373.0 727.6 954.8 3916.0
El mínimo es: 7
El máximo es: 3916
El primer cuartil es: 225.2
El tercer cuartil es: 954.8
La mediana: 373
La media es: 727.6
La comunidad con mayor número total de centros es Castilla y León esto se debe a que tiene un gran número de consultorios locales. Podemos relacionar su gran numero de consultorios locales a que es la comunidad con mayor número de municipios, ya que es en la que mas pueblos hay de toda España como ya hemos analizado anteriormente.
El mínimo corresponde a Ceuta y Melilla esto probablemente se debe a que son ciudades, no comunidades y por eso tienen menor población y menor número de centros de salud.
Columna “Centros_de_salud_por_Comunidad”
Media y mediana
mean(as.double(Centros_de_salud$Centros_de_salud_por_comunidad), na.rm = TRUE)
## [1] 169.5
La media del número de centros de salud por comunidad y/o ciudad autónoma es 169.5
median(as.double(Centros_de_salud$Centros_de_salud_por_comunidad), na.rm = TRUE)
## [1] 114.5
La medina del número de centros de salud por comunidad y/o ciudad autónoma es 114.5
La mediana de los datos demográficos no se distancia mucho de la media, por lo que no habrá datos muy extremos.
summary(as.double(Centros_de_salud$Centros_de_salud_por_comunidad), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7.0 61.5 114.5 169.5 258.2 418.0
El mínimo es: 7
El máximo es: 418
El primer cuartil es: 61.5
El tercer cuartil es: 258.2
La mediana: 114.5
La media es: 169.5
La comunidad con mayor número de centros de salud es Cataluña que es una de las comunidades con mayor densidad demográfica.
El mínimo corresponde a Ceuta y Melilla esto probablemente se debe a que son ciudades, no comunidades y por eso tienen menor población y menor número de centros de salud.
Columna “Consultorios_locales”
Media y mediana
mean(as.double(Centros_de_salud$Consultorios_locales), na.rm = TRUE)
## [1] 558.0556
La media del número de centros de salud por comunidad y/o ciudad autónoma es 558.0556
median(as.double(Centros_de_salud$Consultorios_locales), na.rm = TRUE)
## [1] 177
La medina del número de centros de salud por comunidad y/o ciudad autónoma es 177
La mediana de los datos demográficos se distancia mucho de la media, por lo que habrá datos muy extremos.
summary(as.double(Centros_de_salud$Consultorios_locales), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0 146.8 177.0 558.1 733.5 3669.0
El mínimo es: 0
El máximo es: 3669
El primer cuartil es: 146.8
El tercer cuartil es: 558.1
La mediana: 558.1
La media es: 177
La comunidad con mayor número de consultorios locales es Castilla y León que es la comunidad con mayor número de pueblos y, por eso, tiene un gran número de consultorios locales.
El mínimo corresponde a Ceuta y Melilla esto se debe a que son ciudades y en las ciudades no hay consultorios locales, hay centros de salud.
Columna “Tasa_por_100.000_habitantes”
Media y mediana
mean(as.double(Centros_de_salud$Tasa_por_100.000_habitantes), na.rm = TRUE)
## [1] 35.8
La media del número de centros de salud por comunidad y/o ciudad autónoma es 35.8
median(as.double(Centros_de_salud$Tasa_por_100.000_habitantes), na.rm = TRUE)
## [1] 17.85
La medina del número de centros de salud por comunidad y/o ciudad autónoma es 17.85
La mediana de los datos demográficos se distancia mucho de la media, por lo que habrá datos muy extremos.
summary(as.double(Centros_de_salud$Tasa_por_100.000_habitantes), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 4.10 15.07 17.85 35.80 48.48 163.00
El mínimo es: 4.1
El máximo es: 163
El primer cuartil es: 15.07
El tercer cuartil es: 35.8
La mediana: 17.85
La media es: 35.8
La comunidad con mayor tasa por 100.000 habitantes de centors de salud y consultorios locales es Castilla y León que es la comunidad con mayor número de pueblos y, por eso, tiene un gran número de consultorios locales.
El mínimo corresponde a Ceuta y Melilla esto puede deberse a que el hecho de estar fuera de la península tienen una mayor falta de recursos y ayudas por parte del Estado.
library(tidyverse)
ggplot(data = Centros_de_salud, aes(x = `...1`, y = `Total_de_centros`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("Número total de centros de salud") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Fundamentalmente podemos ver que la cantidad de los centros de salud por comunidad autónoma depende de la cantidad de localidades que tenga la propia comunidad. Por ello, Castilla y León y Andalucia presentan los valores máximos.
No podemos inferir ninguna relación con respecto a que el hecho de tener más centros de salud suponga una mayor calidad de la asistencia sanitaria. De hecho probablemente sea al contrario, considerando que todos los habitantes tienen que tener disponible algún centro sanitario cerca de su domicilio, cuanto más centralizada este la asistencia más calidad tendrán los equipos disponibles.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Limitaciones_vida_cotidiana <- read_excel("DATA/Limitaciones vida cotidiana.xlsx")
View(Limitaciones_vida_cotidiana)
2. Vamos a comprobar algunas medidas estadísticas con la información recogidos en las distintas columnas
dim(Limitaciones_vida_cotidiana)
## [1] 19 7
class(Limitaciones_vida_cotidiana)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 7 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(Limitaciones_vida_cotidiana)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.3.4..1.69..3.13..0.87..1.63..1.67..2.09..2.86..2.56..2.65..1.56..2.08..1.84..3.31..1.87..2.07..1.43..1.96..1.23."
## [3] "c.3.08..1.56..2.68..2.58..0.69..2.77..3.19..2.17..3.16..2.46..1.64..3.26..1.75..3.14..2.61..2.29..2.53..3.51..2.74."
## [4] "c.4.9..3.92..3.76..2.54..2.98..2.53..4.24..5.43..3.93..3.33..1.68..3.78..2.91..3.42..1.84..2.83..2.9..4.89..6.16."
## [5] "c.2.54..1.7..1.89..2.04..1.13..1.13..1.22..1.35..2.07..1.63..1.45..2.71..1.09..1.36..0.69..1.66..1.7..0.39..0.35."
## [6] "c.5.91..6.93..4.96..3.01..6.11..5.84..5.02..7.03..6.17..5.83..4.6..7.1..4.66..6.86..4.11..5.89..5.83..6.38..5.55."
## [7] "c.1.96..1.26..1.48..2.63..1.35..1.9..1.46..2.24..2.62..1.95..0.99..1.99..1.16..2.92..0.58..1.6..1.77..3.09..0.35."
Limitaciones_vida_cotidiana$`Para cocinar`
## [1] 3.40 1.69 3.13 0.87 1.63 1.67 2.09 2.86 2.56 2.65 1.56 2.08 1.84 3.31 1.87
## [16] 2.07 1.43 1.96 1.23
is.double(Limitaciones_vida_cotidiana$`Para cocinar`)
## [1] TRUE
typeof(Limitaciones_vida_cotidiana$`Para cocinar`)
## [1] "double"
Los datos de todas las columnsa son de tipo “double”.
summary(Limitaciones_vida_cotidiana, na.rm = TRUE)
## Comunidad Para cocinar Para usar el teléfono Para realizar compras
## Length:19 Min. :0.870 Min. :0.690 Min. :1.680
## Class :character 1st Qu.:1.650 1st Qu.:2.230 1st Qu.:2.865
## Mode :character Median :1.960 Median :2.610 Median :3.420
## Mean :2.100 Mean :2.516 Mean :3.577
## 3rd Qu.:2.605 3rd Qu.:3.110 3rd Qu.:4.085
## Max. :3.400 Max. :3.510 Max. :6.160
## Para administrar los medicamentos Para realizar tareas domésticas
## Min. :0.350 Min. :3.010
## 1st Qu.:1.130 1st Qu.:4.990
## Median :1.450 Median :5.840
## Mean :1.479 Mean :5.673
## 3rd Qu.:1.795 3rd Qu.:6.275
## Max. :2.710 Max. :7.100
## Para ocuparse de los trámites administrativos diarios
## Min. :0.350
## 1st Qu.:1.305
## Median :1.770
## Mean :1.753
## 3rd Qu.:2.115
## Max. :3.090
Media_cocinar <- mean(Limitaciones_vida_cotidiana$`Para cocinar`, na.rm=TRUE)
Media_cocinar
## [1] 2.1
Media_tfno <- mean(Limitaciones_vida_cotidiana$`Para usar el teléfono`, na.rm=TRUE)
Media_tfno
## [1] 2.516316
Media_compras <- mean(Limitaciones_vida_cotidiana$`Para realizar compras`, na.rm=TRUE)
Media_compras
## [1] 3.577368
Media_medicamentos <- mean(Limitaciones_vida_cotidiana$`Para administrar los medicamentos`, na.rm=TRUE)
Media_medicamentos
## [1] 1.478947
Media_tareas <- mean(Limitaciones_vida_cotidiana$`Para realizar tareas domésticas`, na.rm=TRUE)
Media_tareas
## [1] 5.673158
Media_tramites <- mean(Limitaciones_vida_cotidiana$`Para ocuparse de los trámites administrativos diarios`, na.rm=TRUE)
Media_tramites
## [1] 1.752632
Medias <- c(Media_cocinar, Media_tfno, Media_compras, Media_medicamentos, Media_tareas, Media_tramites)
max(Medias, na.rm=TRUE)
## [1] 5.673158
Medias[max(Medias, na.rm=TRUE)]
## [1] 5.673158
Comparando la media de todas las limitaciones descritas vemos que la mayor problemática, en líneas generales, para las personas discapacitadas viene a la hora de realizar las tareas domésticas.
summary(Limitaciones_vida_cotidiana$`Para cocinar`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.870 1.650 1.960 2.100 2.605 3.400
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para cocinar`== min(Limitaciones_vida_cotidiana$`Para cocinar`, na.rm = TRUE)]
## [1] "Balears, Illes"
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para cocinar` == max(Limitaciones_vida_cotidiana$`Para cocinar`, na.rm = TRUE)]
## [1] "Andalucía"
library(tidyverse)
ggplot(data = Limitaciones_vida_cotidiana, aes(x = `Comunidad`, y = `Para cocinar`)) + geom_bar(stat="identity", position="stack", fill="pink") + ggtitle("Para cocinar") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para cocinar, las Islas Baleares presentan la tasa más baja, mientras que Andalucía presenta valores más altos. Fijándonos en las comunidades más significativas, podríamos visualizar que el las zonas más rurales los discapacitados parece que tienen menos dificultades para cocinar.
summary(Limitaciones_vida_cotidiana$`Para realizar compras`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.680 2.865 3.420 3.577 4.085 6.160
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para realizar compras`== min(Limitaciones_vida_cotidiana$`Para realizar compras`, na.rm = TRUE)]
## [1] "Extremadura"
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para realizar compras` == max(Limitaciones_vida_cotidiana$`Para realizar compras`, na.rm = TRUE)]
## [1] "Melilla"
library(tidyverse)
ggplot(data = Limitaciones_vida_cotidiana, aes(x = `Comunidad`, y = `Para realizar compras`)) + geom_bar(stat="identity", position="stack", fill="green") + ggtitle("Para realizar compras") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para hacer compras, Extremadura presenta la tasa más baja, mientras que Melilla presenta valores más altos. No hay ninguna diferencia apreciable a simple vista entre las zonas rurales y las zonas urbanas.
summary(Limitaciones_vida_cotidiana$`Para usar el teléfono`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.690 2.230 2.610 2.516 3.110 3.510
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para usar el teléfono`== min(Limitaciones_vida_cotidiana$`Para usar el teléfono`, na.rm = TRUE)]
## [1] "Canarias"
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para usar el teléfono` == max(Limitaciones_vida_cotidiana$`Para usar el teléfono`, na.rm = TRUE)]
## [1] "Ceuta"
library(tidyverse)
ggplot(data = Limitaciones_vida_cotidiana, aes(x = `Comunidad`, y = `Para usar el teléfono`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("Para usar el teléfono") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para usar el teléfono, Canarias presenta la tasa más baja, mientras que Ceuta presenta valores más altos. No hay ninguna diferencia apreciable a simple vista entre las zonas rurales y las zonas urbanas.
summary(Limitaciones_vida_cotidiana$`Para administrar los medicamentos`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.350 1.130 1.450 1.479 1.795 2.710
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para administrar los medicamentos`== min(Limitaciones_vida_cotidiana$`Para administrar los medicamentos`, na.rm = TRUE)]
## [1] "Melilla"
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para administrar los medicamentos` == max(Limitaciones_vida_cotidiana$`Para administrar los medicamentos`, na.rm = TRUE)]
## [1] "Galicia"
library(tidyverse)
ggplot(data = Limitaciones_vida_cotidiana, aes(x = `Comunidad`, y = `Para administrar los medicamentos`)) + geom_bar(stat="identity", position="stack", fill="blue") + ggtitle("Para administrar los medicamentos") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para administrar los medicamentos, Melilla presenta la tasa más baja, mientras que Galicia presenta valores más altos. No hay ninguna diferencia apreciable a simple vista entre las zonas rurales y las zonas urbanas.
summary(Limitaciones_vida_cotidiana$`Para realizar tareas domésticas`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.010 4.990 5.840 5.673 6.275 7.100
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para realizar tareas domésticas`== min(Limitaciones_vida_cotidiana$`Para realizar tareas domésticas`, na.rm = TRUE)]
## [1] "Balears, Illes"
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para realizar tareas domésticas` == max(Limitaciones_vida_cotidiana$`Para realizar tareas domésticas`, na.rm = TRUE)]
## [1] "Galicia"
library(tidyverse)
ggplot(data = Limitaciones_vida_cotidiana, aes(x = `Comunidad`, y = `Para realizar tareas domésticas`)) + geom_bar(stat="identity", position="stack", fill="orange") + ggtitle("Para realizar tareas domésticas") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para realizar las tareas domésticas, las Islas Baleares presentan la tasa más baja, mientras que Galicia presenta valores más altos. No hay ninguna diferencia apreciable a simple vista entre las zonas rurales y las zonas urbanas.
summary(Limitaciones_vida_cotidiana$`Para ocuparse de los trámites administrativos diarios`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.350 1.305 1.770 1.753 2.115 3.090
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para ocuparse de los trámites administrativos diarios`== min(Limitaciones_vida_cotidiana$`Para ocuparse de los trámites administrativos diarios`, na.rm = TRUE)]
## [1] "Melilla"
Limitaciones_vida_cotidiana$`Comunidad`[Limitaciones_vida_cotidiana$`Para ocuparse de los trámites administrativos diarios` == max(Limitaciones_vida_cotidiana$`Para ocuparse de los trámites administrativos diarios`, na.rm = TRUE)]
## [1] "Ceuta"
library(tidyverse)
ggplot(data = Limitaciones_vida_cotidiana, aes(x = `Comunidad`, y = `Para ocuparse de los trámites administrativos diarios`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("Para ocuparse de los trámites administrativos diarios") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para ocuparse de los trámites administrativos diarios, Melilla presenta la tasa más baja, mientras que Ceuta presenta valores más altos. No hay ninguna diferencia apreciable a simple vista entre las zonas rurales y las zonas urbanas.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Limitaciones_actividades_basicas <- read_excel("DATA/Limitaciones actividades basicas.xlsx")
View(Limitaciones_actividades_basicas)
2. Vamos a comprobar algunas medidas estadísticas con la información recogidos en las distintas columnas
dim(Limitaciones_actividades_basicas)
## [1] 19 9
class(Limitaciones_actividades_basicas)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 8 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(Limitaciones_actividades_basicas)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.15.82..14.26..15.93..15.01..16.52..16.31..16.45..17.19..15.61..14.19..13.31..15.49..13.84..19.65..13.82..13.67..16.17..13.81..9.07."
## [3] "c.9.43..9.85..11.34..10.46..8.16..8.08..9.03..8.92..9.95..8.26..7.47..12.64..8.75..10.57..9.95..9.41..9.05..5.65..4.81."
## [4] "c.7.49..5.03..7.59..3.9..5.3..5.62..6.67..6.35..6.68..5.52..4.93..6.58..5.19..6.97..3.33..4.51..6.16..4.74..7.28."
## [5] "c.10.13..8.75..11.48..7.3..10.68..9.7..10.68..10.56..9.53..9.36..8.56..10.84..9.37..9.69..5.79..8.2..8.92..12.19..11.63."
## [6] "c.13.44..10.61..14.38..10.42..11.83..14.4..12.5..12.04..12.12..12.06..9.58..14.85..10.76..14.28..9.97..8.07..8.2..5.08..8.57."
## [7] "c.4.14..2.27..4.69..4.56..3.96..3.93..4.76..3.37..3.94..4.22..3.29..4.4..2.93..6.73..2.13..3.43..5.7..3.33..4.06."
## [8] "c.5.83..5.08..7.04..4.09..6.82..5.67..5.5..7.8..5.99..5.26..4.43..5.6..4.8..7..3.19..5.35..5.24..4.81..10.41."
## [9] "c.5.91..5.51..6.03..2.69..5.7..4.91..6.53..5.38..5.67..6.18..4.6..4.01..5.66..5.11..3.58..3.87..5.27..2.75..6.83."
Limitaciones_actividades_basicas$`Para ver`
## [1] 15.82 14.26 15.93 15.01 16.52 16.31 16.45 17.19 15.61 14.19 13.31 15.49
## [13] 13.84 19.65 13.82 13.67 16.17 13.81 9.07
is.double(Limitaciones_actividades_basicas$`Para ver`)
## [1] TRUE
typeof(Limitaciones_actividades_basicas$`Para ver`)
## [1] "double"
Los datos de todas las columnsa son de tipo “double”.
summary(Limitaciones_actividades_basicas, na.rm = TRUE)
## Comunidad Para ver Para oír Para caminar
## Length:19 Min. : 9.07 Min. : 4.810 Min. :3.330
## Class :character 1st Qu.:13.83 1st Qu.: 8.210 1st Qu.:4.980
## Mode :character Median :15.49 Median : 9.050 Median :5.620
## Mean :15.06 Mean : 9.041 Mean :5.781
## 3rd Qu.:16.24 3rd Qu.: 9.950 3rd Qu.:6.675
## Max. :19.65 Max. :12.640 Max. :7.590
## Para subir y bajar escaleras Para recordar o concentrarse Para comunicarse
## Min. : 5.790 Min. : 5.080 Min. :2.130
## 1st Qu.: 8.835 1st Qu.: 9.775 1st Qu.:3.350
## Median : 9.690 Median :11.830 Median :3.960
## Mean : 9.651 Mean :11.219 Mean :3.992
## 3rd Qu.:10.680 3rd Qu.:12.970 3rd Qu.:4.480
## Max. :12.190 Max. :14.850 Max. :6.730
## Para levantar objetos Para utilizar manos y dedos
## Min. : 3.190 Min. :2.690
## 1st Qu.: 4.945 1st Qu.:4.305
## Median : 5.500 Median :5.380
## Mean : 5.785 Mean :5.063
## 3rd Qu.: 6.405 3rd Qu.:5.805
## Max. :10.410 Max. :6.830
Media_ver <- mean(Limitaciones_actividades_basicas$`Para ver`, na.rm=TRUE)
Media_ver
## [1] 15.05895
Media_oir <- mean(Limitaciones_actividades_basicas$`Para oír`, na.rm=TRUE)
Media_oir
## [1] 9.041053
Media_caminar <- mean(Limitaciones_actividades_basicas$`Para caminar`, na.rm=TRUE)
Media_caminar
## [1] 5.781053
Media_escaleras <- mean(Limitaciones_actividades_basicas$`Para subir y bajar escaleras`, na.rm=TRUE)
Media_escaleras
## [1] 9.650526
Media_recordar <- mean(Limitaciones_actividades_basicas$`Para recordar o concentrarse`, na.rm=TRUE)
Media_recordar
## [1] 11.21895
Media_comunicarse <- mean(Limitaciones_actividades_basicas$`Para comunicarse`, na.rm=TRUE)
Media_comunicarse
## [1] 3.991579
Media_objetos <- mean(Limitaciones_actividades_basicas$`Para levantar objetos`, na.rm=TRUE)
Media_objetos
## [1] 5.784737
Media_manos <- mean(Limitaciones_actividades_basicas$`Para utilizar manos y dedos`, na.rm=TRUE)
Media_manos
## [1] 5.062632
Medias <- c(Media_ver, Media_oir, Media_caminar, Media_escaleras, Media_recordar, Media_comunicarse, Media_objetos, Media_manos)
max(Medias, na.rm=TRUE)
## [1] 15.05895
Comparando la media de todas las limitaciones relacionadas con actividades básicas vemos que la mayor problemática, en líneas generales, está relacionada con la visión. Es algo sorprendente proque habíamos visto, analizando la naturaleza de la mayor parte de las discapacidades, que las discapacidades relacionadas con la visión no eran muy numerosas. Así consideraremos que la dificultad para ver viene como un problema asociado a una discapacidad que no esté direcatamente originada en los ojos.
Vamos a demostrar que realmente no existe relación entre la dificultad de visión y las discapacidades de la visión.
Mutate_Discapacidad_y_Autonomia_personal <- Discapacidad_y_Autonomia_personal %>%
select(`Comunidad`, `Tasa de discapacidad de visión`) %>%
mutate(`Porcentaje tasa discapacidad de visión`= `Tasa de discapacidad de visión`*100)
Mutate_Discapacidad_y_Autonomia_personal <- Mutate_Discapacidad_y_Autonomia_personal %>%
select(`Comunidad`, `Porcentaje tasa discapacidad de visión`)
Mutate_Discapacidad_y_Autonomia_personal
## # A tibble: 19 x 2
## Comunidad `Porcentaje tasa discapacidad de visión`
## <chr> <dbl>
## 1 Andalucía 1.62
## 2 Aragón 0.55
## 3 Asturias, Principado de 0.66
## 4 Balears, Illes 1.37
## 5 Canarias 1.31
## 6 Cantabria 1.03
## 7 Castilla y León 0.94
## 8 Castilla - La Mancha 2.08
## 9 Cataluña 1.36
## 10 Comunitat Valenciana 1.51
## 11 Extremadura 0.54
## 12 Galicia 0.92
## 13 Madrid, Comunidad de 0.91
## 14 Murcia, Región de 1.61
## 15 Navarra, Comunidad Foral de 1.02
## 16 País Vasco 1.06
## 17 Rioja, La 0.84
## 18 Ceuta 1.51
## 19 Melilla 2.42
Select_Limitaciones <- Limitaciones_actividades_basicas %>%
select(`Comunidad`, `Para ver`)
Select_Limitaciones
## # A tibble: 19 x 2
## Comunidad `Para ver`
## <chr> <dbl>
## 1 Andalucía 15.8
## 2 Aragón 14.3
## 3 Asturias, Principado de 15.9
## 4 Balears, Illes 15.0
## 5 Canarias 16.5
## 6 Cantabria 16.3
## 7 Castilla y León 16.4
## 8 Castilla - La Mancha 17.2
## 9 Cataluña 15.6
## 10 Comunitat Valenciana 14.2
## 11 Extremadura 13.3
## 12 Galicia 15.5
## 13 Madrid, Comunidad de 13.8
## 14 Murcia, Región de 19.6
## 15 Navarra, Comunidad Foral de 13.8
## 16 País Vasco 13.7
## 17 Rioja, La 16.2
## 18 Ceuta 13.8
## 19 Melilla 9.07
Relacion_vision <- full_join(x = Mutate_Discapacidad_y_Autonomia_personal, y = Select_Limitaciones, by = "Comunidad")
Relacion_vision
## # A tibble: 19 x 3
## Comunidad `Porcentaje tasa discapacidad de visi~ `Para ver`
## <chr> <dbl> <dbl>
## 1 Andalucía 1.62 15.8
## 2 Aragón 0.55 14.3
## 3 Asturias, Principado de 0.66 15.9
## 4 Balears, Illes 1.37 15.0
## 5 Canarias 1.31 16.5
## 6 Cantabria 1.03 16.3
## 7 Castilla y León 0.94 16.4
## 8 Castilla - La Mancha 2.08 17.2
## 9 Cataluña 1.36 15.6
## 10 Comunitat Valenciana 1.51 14.2
## 11 Extremadura 0.54 13.3
## 12 Galicia 0.92 15.5
## 13 Madrid, Comunidad de 0.91 13.8
## 14 Murcia, Región de 1.61 19.6
## 15 Navarra, Comunidad Foral de 1.02 13.8
## 16 País Vasco 1.06 13.7
## 17 Rioja, La 0.84 16.2
## 18 Ceuta 1.51 13.8
## 19 Melilla 2.42 9.07
summary(Relacion_vision)
## Comunidad Porcentaje tasa discapacidad de visión Para ver
## Length:19 Min. :0.540 Min. : 9.07
## Class :character 1st Qu.:0.915 1st Qu.:13.83
## Mode :character Median :1.060 Median :15.49
## Mean :1.224 Mean :15.06
## 3rd Qu.:1.510 3rd Qu.:16.24
## Max. :2.420 Max. :19.65
Pivot_vision <- pivot_longer(data = Relacion_vision, names_to = "Variables", values_to = "Valores", cols = c(`Porcentaje tasa discapacidad de visión`:`Para ver`))
Pivot_vision
## # A tibble: 38 x 3
## Comunidad Variables Valores
## <chr> <chr> <dbl>
## 1 Andalucía Porcentaje tasa discapacidad de visión 1.62
## 2 Andalucía Para ver 15.8
## 3 Aragón Porcentaje tasa discapacidad de visión 0.55
## 4 Aragón Para ver 14.3
## 5 Asturias, Principado de Porcentaje tasa discapacidad de visión 0.66
## 6 Asturias, Principado de Para ver 15.9
## 7 Balears, Illes Porcentaje tasa discapacidad de visión 1.37
## 8 Balears, Illes Para ver 15.0
## 9 Canarias Porcentaje tasa discapacidad de visión 1.31
## 10 Canarias Para ver 16.5
## # ... with 28 more rows
ggplot(data = Pivot_vision, aes(x = `Comunidad`, y = `Valores`)) + geom_bar(stat="identity", position="stack", aes(fill = factor(Variables))) + ggtitle("Relación entre la dificultad de visión y las discapacidades de la visión") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Vemos que no se incrementan de la misma forma ambos atributos, aunque en ciertas comunidades si que parecen crecer de forma proporcional, en la mayoría de ellas no. De hecho, ni el máximo ni el mínimo coinciden.
summary(Limitaciones_actividades_basicas$`Para ver`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 9.07 13.83 15.49 15.06 16.24 19.65
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para ver`== min(Limitaciones_actividades_basicas$`Para ver`, na.rm = TRUE)]
## [1] "Melilla"
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para ver` == max(Limitaciones_actividades_basicas$`Para ver`, na.rm = TRUE)]
## [1] "Murcia, Región de"
library(tidyverse)
ggplot(data = Limitaciones_actividades_basicas, aes(x = `Comunidad`, y = `Para ver`)) + geom_bar(stat="identity", position="stack", fill="pink") + ggtitle("Para ver") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para ver (las mayoritarias) vemos que en Melilla es donde menos se presentan, mientras que Murcia presenta la mayor proporción.
summary(Limitaciones_actividades_basicas$`Para oír`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 4.810 8.210 9.050 9.041 9.950 12.640
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para oír`== min(Limitaciones_actividades_basicas$`Para oír`, na.rm = TRUE)]
## [1] "Melilla"
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para oír` == max(Limitaciones_actividades_basicas$`Para oír`, na.rm = TRUE)]
## [1] "Galicia"
library(tidyverse)
ggplot(data = Limitaciones_actividades_basicas, aes(x = `Comunidad`, y = `Para oír`)) + geom_bar(stat="identity", position="stack", fill="green") + ggtitle("Para oír") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para oír vemos que en Melilla es donde menos se presentan, mientras que Galicia presenta la mayor proporción.
summary(Limitaciones_actividades_basicas$`Para caminar`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.330 4.980 5.620 5.781 6.675 7.590
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para caminar`== min(Limitaciones_actividades_basicas$`Para caminar`, na.rm = TRUE)]
## [1] "Navarra, Comunidad Foral de"
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para caminar` == max(Limitaciones_actividades_basicas$`Para caminar`, na.rm = TRUE)]
## [1] "Asturias, Principado de"
library(tidyverse)
ggplot(data = Limitaciones_actividades_basicas, aes(x = `Comunidad`, y = `Para caminar`)) + geom_bar(stat="identity", position="stack", fill="blue") + ggtitle("Para caminar") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para caminar vemos que en Navarra es donde menos se presentan, mientras que Asturias presenta la mayor proporción.
Considerando que la mayor parte de las tetraplejias que impiden andar vienen causadas por accidentes de tráfico, podemos intuir que en Asturias hay un alto porcentaje de accidentes en la carretera. No es un tema transcendente para nuestro trabajo, pero hemos indagado un poco y, precisamente, hemos descubierto que en Asturias hay muchos accidentes por las carreteras de montaña y la presencia de animales silvestres en la calzada. Por si a alguien le resulta de interés vamos a adjuntar un abstract a continuación que amplia un poco este último tema mencionado.
Fauna silvestre y accidentes de tráfico en Asturias.
summary(Limitaciones_actividades_basicas$`Para subir y bajar escaleras`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.790 8.835 9.690 9.651 10.680 12.190
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para subir y bajar escaleras`== min(Limitaciones_actividades_basicas$`Para subir y bajar escaleras`, na.rm = TRUE)]
## [1] "Navarra, Comunidad Foral de"
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para subir y bajar escaleras` == max(Limitaciones_actividades_basicas$`Para subir y bajar escaleras`, na.rm = TRUE)]
## [1] "Ceuta"
library(tidyverse)
ggplot(data = Limitaciones_actividades_basicas, aes(x = `Comunidad`, y = `Para subir y bajar escaleras`)) + geom_bar(stat="identity", position="stack", fill="brown") + ggtitle("Para subir y bajar escaleras") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para subir y bajar escaleras vemos que en Navarra es donde menos se presentan, mientras que Ceuta presenta la mayor proporción.
summary(Limitaciones_actividades_basicas$`Para recordar o concentrarse`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.080 9.775 11.830 11.219 12.970 14.850
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para recordar o concentrarse`== min(Limitaciones_actividades_basicas$`Para recordar o concentrarse`, na.rm = TRUE)]
## [1] "Ceuta"
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para recordar o concentrarse` == max(Limitaciones_actividades_basicas$`Para recordar o concentrarse`, na.rm = TRUE)]
## [1] "Galicia"
library(tidyverse)
ggplot(data = Limitaciones_actividades_basicas, aes(x = `Comunidad`, y = `Para recordar o concentrarse`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("Para recordar o concentrarse") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para recordar o concentrarse vemos que en Ceuta es donde menos se presentan, mientras que Galicia presenta la mayor proporción.
Este dato es muy importante para los médicos porque una persona que tiene dificultades para recordar o concentrarse tienen algún tipo de afección cognitiva donde se ve involucrado el sistema nervioso. Resulta curioso ver como Galicia presenta el índice más alto tanto de dificultades para oir como para recordar, esto podría ver porque el control de la audición también reside en el cerebro, en concreto, en el lóbulo temporal.
summary(Limitaciones_actividades_basicas$`Para comunicarse`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.130 3.350 3.960 3.992 4.480 6.730
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para comunicarse`== min(Limitaciones_actividades_basicas$`Para comunicarse`, na.rm = TRUE)]
## [1] "Navarra, Comunidad Foral de"
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para comunicarse` == max(Limitaciones_actividades_basicas$`Para comunicarse`, na.rm = TRUE)]
## [1] "Murcia, Región de"
library(tidyverse)
ggplot(data = Limitaciones_actividades_basicas, aes(x = `Comunidad`, y = `Para comunicarse`)) + geom_bar(stat="identity", position="stack", fill="yellow") + ggtitle("Para comunicarse") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para comunicarse vemos que en Navarra es donde menos se presentan, mientras que Murcia presenta la mayor proporción.
summary(Limitaciones_actividades_basicas$`Para levantar objetos`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.190 4.945 5.500 5.785 6.405 10.410
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para levantar objetos`== min(Limitaciones_actividades_basicas$`Para levantar objetos`, na.rm = TRUE)]
## [1] "Navarra, Comunidad Foral de"
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para levantar objetos` == max(Limitaciones_actividades_basicas$`Para levantar objetos`, na.rm = TRUE)]
## [1] "Melilla"
library(tidyverse)
ggplot(data = Limitaciones_actividades_basicas, aes(x = `Comunidad`, y = `Para levantar objetos`)) + geom_bar(stat="identity", position="stack", fill="purple") + ggtitle("Para levantar objetos") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para levantar objetos vemos que en Navarra es donde menos se presentan, mientras que Melilla presenta la mayor proporción.
summary(Limitaciones_actividades_basicas$`Para utilizar manos y dedos`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.690 4.305 5.380 5.063 5.805 6.830
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para utilizar manos y dedos`== min(Limitaciones_actividades_basicas$`Para utilizar manos y dedos`, na.rm = TRUE)]
## [1] "Balears, Illes"
Limitaciones_actividades_basicas$`Comunidad`[Limitaciones_actividades_basicas$`Para utilizar manos y dedos` == max(Limitaciones_actividades_basicas$`Para utilizar manos y dedos`, na.rm = TRUE)]
## [1] "Melilla"
library(tidyverse)
ggplot(data = Limitaciones_actividades_basicas, aes(x = `Comunidad`, y = `Para utilizar manos y dedos`)) + geom_bar(stat="identity", position="stack", fill="black") + ggtitle("Para utilizar manos y dedos") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las limitaciones para utilizar manos y dedos vemos que en Islas Baleares es donde menos se presentan, mientras que Melilla presenta la mayor proporción.
Como la mayor parte de las actividades cotidianas son manuales, es decir, requieren de la utilización de manos y dedos, vamos a ver si existe una relación entre las limitaciones para realizar las tareas del hogar que hemos visto en el anterior set de datos y esta limitación para utilizar manos y dedos.
Select_Limitaciones_cotidianas <- Limitaciones_vida_cotidiana %>%
select(`Comunidad`, `Para realizar tareas domésticas`)
Select_Limitaciones_cotidianas
## # A tibble: 19 x 2
## Comunidad `Para realizar tareas domésticas`
## <chr> <dbl>
## 1 Andalucía 5.91
## 2 Aragón 6.93
## 3 Asturias, Principado de 4.96
## 4 Balears, Illes 3.01
## 5 Canarias 6.11
## 6 Cantabria 5.84
## 7 Castilla y León 5.02
## 8 Castilla - La Mancha 7.03
## 9 Cataluña 6.17
## 10 Comunitat Valenciana 5.83
## 11 Extremadura 4.6
## 12 Galicia 7.1
## 13 Madrid, Comunidad de 4.66
## 14 Murcia, Región de 6.86
## 15 Navarra, Comunidad Foral de 4.11
## 16 País Vasco 5.89
## 17 Rioja, La 5.83
## 18 Ceuta 6.38
## 19 Melilla 5.55
Select_Limitaciones_basicas <- Limitaciones_actividades_basicas %>%
select(`Comunidad`, `Para utilizar manos y dedos`)
Select_Limitaciones_basicas
## # A tibble: 19 x 2
## Comunidad `Para utilizar manos y dedos`
## <chr> <dbl>
## 1 Andalucía 5.91
## 2 Aragón 5.51
## 3 Asturias, Principado de 6.03
## 4 Balears, Illes 2.69
## 5 Canarias 5.7
## 6 Cantabria 4.91
## 7 Castilla y León 6.53
## 8 Castilla - La Mancha 5.38
## 9 Cataluña 5.67
## 10 Comunitat Valenciana 6.18
## 11 Extremadura 4.6
## 12 Galicia 4.01
## 13 Madrid, Comunidad de 5.66
## 14 Murcia, Región de 5.11
## 15 Navarra, Comunidad Foral de 3.58
## 16 País Vasco 3.87
## 17 Rioja, La 5.27
## 18 Ceuta 2.75
## 19 Melilla 6.83
Relacion_manos <- full_join(x = Select_Limitaciones_cotidianas, y = Select_Limitaciones_basicas, by = "Comunidad")
Relacion_manos
## # A tibble: 19 x 3
## Comunidad `Para realizar tareas dom~ `Para utilizar manos ~
## <chr> <dbl> <dbl>
## 1 Andalucía 5.91 5.91
## 2 Aragón 6.93 5.51
## 3 Asturias, Principado de 4.96 6.03
## 4 Balears, Illes 3.01 2.69
## 5 Canarias 6.11 5.7
## 6 Cantabria 5.84 4.91
## 7 Castilla y León 5.02 6.53
## 8 Castilla - La Mancha 7.03 5.38
## 9 Cataluña 6.17 5.67
## 10 Comunitat Valenciana 5.83 6.18
## 11 Extremadura 4.6 4.6
## 12 Galicia 7.1 4.01
## 13 Madrid, Comunidad de 4.66 5.66
## 14 Murcia, Región de 6.86 5.11
## 15 Navarra, Comunidad Foral de 4.11 3.58
## 16 País Vasco 5.89 3.87
## 17 Rioja, La 5.83 5.27
## 18 Ceuta 6.38 2.75
## 19 Melilla 5.55 6.83
Pivot_manos <- pivot_longer(data = Relacion_manos, names_to = "Variables", values_to = "Valores", cols = c(`Para realizar tareas domésticas`:`Para utilizar manos y dedos`))
Pivot_manos
## # A tibble: 38 x 3
## Comunidad Variables Valores
## <chr> <chr> <dbl>
## 1 Andalucía Para realizar tareas domésticas 5.91
## 2 Andalucía Para utilizar manos y dedos 5.91
## 3 Aragón Para realizar tareas domésticas 6.93
## 4 Aragón Para utilizar manos y dedos 5.51
## 5 Asturias, Principado de Para realizar tareas domésticas 4.96
## 6 Asturias, Principado de Para utilizar manos y dedos 6.03
## 7 Balears, Illes Para realizar tareas domésticas 3.01
## 8 Balears, Illes Para utilizar manos y dedos 2.69
## 9 Canarias Para realizar tareas domésticas 6.11
## 10 Canarias Para utilizar manos y dedos 5.7
## # ... with 28 more rows
ggplot(data = Pivot_manos, aes(x = `Comunidad`, y = `Valores`)) + geom_bar(stat="identity", position="stack", aes(fill = factor(Variables))) + ggtitle("Relación entre la dificultad para realizar tareas domésticas y para utilizar manos y dedos") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Vemos que el crecimiento de ambos atributos en las distintas comunidades tiene la misma forma, osea que estas limitaciones son proporcionales. Es lógico pensar que alguien que tiene dificultados para utilizar las manos y los dedos, también tendrá dificultades para realizar las tareas del hogar. Podríamos haberlo comparado con otras columnas del set de limitaciones en la vida cotidiana, porque hay en más tareas donde la utilización de las manos es indispensable, pero la conclusión sería la misma y no queremos alargar más este análisis.
En principio no vemos ningun cambio significativos entre las limitaciones que presentan los discapacitados que viven en zonas rurales y los que viven en zonas urbanas. Aunque podemos cuestionarnos en qué zonas recibirán más ayudas los discapacitados para lidiar con todas estas limitaciones, lo intetaremos contestar más adelante.
Aún así es cierto que nos resulta interesante el caso de dos comunidades. Primeramente, Navarra vuelve a repetirse numerosas veces como la comundiades con menor índice de limitaciones, esto refleja, nuevamente, la gran calidad de su sistema sanitario. Y, por otro lado, la Región de Murcia ha aparecido en varias ocasiones como la comunidad con mayor proporción de discapacitados con limitaciones, este hecho nos hace dudar sobre la calidad de su asistencia sanitaria.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Cuidadores <- read_excel("DATA/Cuidadores.xlsx")
View(Cuidadores)
2. Vamos a comprobar algunas medidas estadísticas de las diferentes columnas del set, que en este caso son tres.
dim(Cuidadores)
## [1] 20 4
class(Cuidadores)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 4 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente que todos los nombres de las columnas cumplan las reglas sintácticas. En este caso todos los datos de dichas columnas son de tipo “double”.
summary(Cuidadores, na.rm = TRUE)
## Comunidad En el hogar de la persona que cuida En otro hogar
## Length:20 Min. : 2.50 Min. : 0.500
## Class :character 1st Qu.: 21.88 1st Qu.: 4.725
## Mode :character Median : 44.05 Median : 11.650
## Mean : 128.01 Mean : 34.285
## 3rd Qu.: 110.42 3rd Qu.: 25.450
## Max. :1280.20 Max. :343.000
## No consta
## Min. : 0.000
## 1st Qu.: 4.975
## Median : 15.250
## Mean : 46.485
## 3rd Qu.: 29.150
## Max. :464.900
summary(Cuidadores$`En el hogar de la persona que cuida`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.50 21.88 44.05 128.01 110.42 1280.20
Cuidadores$`Comunidad`[Cuidadores$`En el hogar de la persona que cuida` == min(Cuidadores$`En el hogar de la persona que cuida`, na.rm = TRUE)]
## [1] "Melilla"
Cuidadores$`Comunidad`[Cuidadores$`En el hogar de la persona que cuida` == max(Cuidadores$`En el hogar de la persona que cuida`, na.rm = TRUE)]
## [1] "Andalucía"
library(tidyverse)
ggplot(data = Cuidadores, aes(x = `Comunidad`, y = `En el hogar de la persona que cuida`)) + geom_bar(stat="identity", position="stack", fill="green") + ggtitle("En el hogar de la persona que cuida") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Los datos obtenidos nos indican que la media de discapacitados que viven en el hogar de la persona que los cuida es del 44.05, en todo el estado. El mínimo de discapacitados en este situación de encuentran en Melilla. Y en cambio el máximo es muy alejado de la media, se trata de los discapacitados en Andalucía. Al parecer la una gran cantidad de los discapacitados viven con las personas que los cuida. Analizaremos este caso más adelante.
summary(Cuidadores$`En otro hogar`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.500 4.725 11.650 34.285 25.450 343.000
Cuidadores$`Comunidad`[Cuidadores$`En otro hogar` == min(Cuidadores$`En otro hogar`, na.rm = TRUE)]
## [1] NA
Cuidadores$`Comunidad`[Cuidadores$`En otro hogar` == max(Cuidadores$`En otro hogar`, na.rm = TRUE)]
## [1] "Andalucía"
library(tidyverse)
ggplot(data = Cuidadores, aes(x = `Comunidad`, y = `En otro hogar`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("En otro hogar") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Por otro lado tenemos a los dicanpacitados que viven en otro hogar, la media es de 11.65 en todo el estado. En este caso, el mínimo se encuaentra en Ceuta. Y el máximo encambio en Andalucía otra vez, con una gran diferencia con el resto de comunidades como en el caso de los discapacitados que viven en el hogar de quien los cuida.
summary(Cuidadores$`No consta`, na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 4.975 15.250 46.485 29.150 464.900
Cuidadores$`Comunidad`[Cuidadores$`No consta` == min(Cuidadores$`No consta`, na.rm = TRUE)]
## [1] NA
Cuidadores$`Comunidad`[Cuidadores$`No consta` == max(Cuidadores$`No consta`, na.rm = TRUE)]
## [1] "Andalucía"
library(tidyverse)
ggplot(data = Cuidadores, aes(x = `Comunidad`, y = `No consta`)) + geom_bar(stat="identity", position="stack", fill="blue")+ ggtitle("No consta") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Respecto a los discapacitados que no consta si viven con la persona que los cuida o que viven en otro hogar, hay una media de 15,25 en todo el estado. El mínimo se vuelve a encontrar en Ceuta. Y el máximo también vuelve a darse en Andalucía, con un dato significativamente más alto que en el resto de comunidades del estado.
Como hemos análizado tres tipos de cuidadores, mediante la comparación de las medias podemos determinar que hay más discapacitados viven en el hogar de la persona que los cuida que los que viven en otros hogares, siempre teniendo encuenta el posible margen de error que podrían causar los que no constan. Cabe a destacar el caso de Andalucía, por sus valores tan significativos y dispares al resto de las comunidades. En las conclusiones finales haremos un join para relacionar el set de los cuidadores junto con el de la economía y el de ayudas, ya que creemos que la relación entre los tres factores puede ser interesante en nuetra investigación.
Aquí vamos a incluir una noticia de una situación sobre un discapacitado en Andalucia donde el sistema sanitario no reconoce su grado de discapacidad. Creemos que si realmente hay muchos casos como este, esto podría una causa por la que una gran cantidad de discapacitados tienen que vivir en la casa de sus cuidadores ante una falta de atención médica.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Necesidades_no_satisfechas <- read_excel("DATA/Necesidades_no _satisfechas.xlsx")
View(Necesidades_no_satisfechas)
2. Vamos a comprobar algunas medidas estadísticas con la información recogidos en la columna “PM10”.
dim(Necesidades_no_satisfechas)
## [1] 19 2
class(Necesidades_no_satisfechas)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 2 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(Necesidades_no_satisfechas)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.0.5..0..0.2..0.6..1.4..0..0.3..0.5..0.3..0.8..0.1..0..0.4..0.2..0.9..0.1..0.1..0..0."
Necesidades_no_satisfechas$Necesidades
## [1] 0.5 0.0 0.2 0.6 1.4 0.0 0.3 0.5 0.3 0.8 0.1 0.0 0.4 0.2 0.9 0.1 0.1 0.0 0.0
is.double(Necesidades_no_satisfechas$Necesidades)
## [1] TRUE
typeof(Necesidades_no_satisfechas$Necesidades)
## [1] "double"
Los datos de la columna “Necesidades” son de tipo “double”.
mean(as.double(Necesidades_no_satisfechas$Necesidades), na.rm = TRUE)
## [1] 0.3368421
La medina de los datos demográficos es 0.3368421.
Necesidades_no_satisfechas$`Comunidades`[Necesidades_no_satisfechas$Necesidades == min(as.double(Necesidades_no_satisfechas$Necesidades), na.rm = TRUE)]
## [1] "Aragón" "Cantabria" "Galicia" "Ceuta" "Melilla"
Las comunidades autónomas españolas con mayor satisfacion, es decir, menor necesidades NO satisfechas son Aragón , Cantabria, Galicia y las ciudades autónomas, Ceuta y Melilla con 0.
Necesidades_no_satisfechas$`Comunidades`[Necesidades_no_satisfechas$Necesidades == max(as.double(Necesidades_no_satisfechas$Necesidades), na.rm = TRUE)]
## [1] "Canarias"
La comunidad autónoma menos satisfecha es Canarias, con 1.4.
summary(as.double(Necesidades_no_satisfechas$Necesidades), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0000 0.0500 0.2000 0.3368 0.5000 1.4000
El mínimo es: 0
El máximo es: 1.4
El primer cuartil es: 0.05
El tercer cuartil es: 0.5
La media es: 0.2
Análisis de las comunidades más significativas
Necesidades_no_satisfechas$`Necesidades`[Necesidades_no_satisfechas$`Comunidades` == "Castilla y León"]
## [1] 0.3
Las necesidades médicas no satisfechas en Castilla y León son ligeramente superiores a la media, 0.3.
Necesidades_no_satisfechas$`Necesidades`[Necesidades_no_satisfechas$`Comunidades` == "Aragón"]
## [1] 0
Los habitantes de Aragón están completamente satisfechos con su sistema sanitario su índice de necesidades no satisfechas es nulo.
Necesidades_no_satisfechas$`Necesidades`[Necesidades_no_satisfechas$`Comunidades` == "Murcia, Región de"]
## [1] 0.2
El índice de necesidades no satisfechas en Murcia está en la media, 0.2.
Necesidades_no_satisfechas$`Necesidades`[Necesidades_no_satisfechas$`Comunidades` == "Madrid, Comunidad de"]
## [1] 0.4
La necesidades mecicas no satisfechas en Madrid son ligeramente más altas, 0.4.
Antes de comenzar a graficar hay que tener instalado el paquete básico Tidyverse.
library(tidyverse)
ggplot(data = Necesidades_no_satisfechas, aes(x = `Comunidades`, y = `Necesidades`)) + geom_bar(stat="identity", position="stack", fill="purple") + ggtitle("Necesidades no satisfechas") + ggtitle("Necesidades no satisfechas de los discapacitados") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
La comunidad menos satisfecha con sus necesidades de cuidados médicos es Canarias la razón podría deberse a que al ser unas islas bastante alejadas de la Península pueden tener menos especialistas y facilidades en sus necesidades médicas.
Las comunidades autónomas españolas con mayor satisfacion, es decir, menor necesidades NO satisfechas son Aragón, Cantabria, Galicia y las ciudades autónomas, Ceuta y Melilla.
Como hemos analizado anteriormente Murcia y Madrid son las comunidades con mayor población, ambas tienen una baja puntuación por lo que sus necesidades de cuidados médicos son aceptables. Podemos relacionar esto con que a un mayor índice de población mayor numero de centros de salud y recursos para tratar a los pacientes y/o cuidadores.
Si nos fijamos en las comunidades más significativas que tratabamos antes, no vemos ningún patrón claro que relacione las necesidades medicas no satisfechas con el ambiente rural o el urbano. De hecho, Madrid y Murcia, las comunidades urbanas, presentan mayor indice de insatisfacción social con los servicios médicos. Aún así no vemos que esto ocurra en todos los casos porque en Canarias y Navarra, las comunidades menos satisfechas, no apreciamos un caracter urbanita significativo.
Es probable que las necesidades no satisfechas de cuidados médicos estén marcadas por otros factores como el nivel económico de la comunidad, la media de edad de sus habitantes, etc.
1. En primer lugar importamos los datos con “read_excel” porque tienen la extensión “.xsls”.
library(readxl)
Falta_de_ayudas_en_las_personas_con_discapacidad <- read_excel("DATA/Falta de ayudas en las personas con discapacidad.xlsx")
View(Falta_de_ayudas_en_las_personas_con_discapacidad)
2. Vamos a comprobar algunas medidas estadísticas con la información recogidos en las distintas columnas
dim(Falta_de_ayudas_en_las_personas_con_discapacidad)
## [1] 19 5
class(Falta_de_ayudas_en_las_personas_con_discapacidad)
## [1] "tbl_df" "tbl" "data.frame"
El set de datos es un tipo de data frame conocido como tibble.
Además sabemos que el tibble contiene 19 filas y 4 columnas, esto es así porque España se compone de 17 comunidades autónomas y 2 cuidades autónomas.
También es conveniente transformar todos los nombres de la columna con “make.names” para cumplan las reglas sintácticas.
make.names(Falta_de_ayudas_en_las_personas_con_discapacidad)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c..9....7.8....7.06....3.77....7.97....5.46....7.19....3.72....13.05....8.26....8.6....11.7....10.75....16.079999999999998....12.76....6.74....6.86....NA....12.97.."
## [3] "c..14.07....10.85....9.2100000000000009....17.12....9.1....10.32....9.49....9.2100000000000009....11.12....12.31....12.14....7.99....8.1999999999999993....9.3000000000000007....9.4....7.39....12.62....NA....14.14.."
## [4] "c..30.22....28.37....34.770000000000003....32.47....23.29....28.78....27.47....35.67....32.56....26.93....30.07....31.88....26.96....34.6....18.97....34.479999999999997....22.51....NA....29.22.."
## [5] "c..46.7....52.98....48.97....46.64....59.64....55.44....55.86....51.39....43.28....52.51....49.19....48.42....54.09....40.01....58.87....51.39....58.01....NA....43.68.."
Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de ayuda técnica`
## [1] "9" "7.8" "7.06"
## [4] "3.77" "7.97" "5.46"
## [7] "7.19" "3.72" "13.05"
## [10] "8.26" "8.6" "11.7"
## [13] "10.75" "16.079999999999998" "12.76"
## [16] "6.74" "6.86" "NA"
## [19] "12.97"
is.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de ayuda técnica`)
## [1] FALSE
typeof(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de ayuda técnica`)
## [1] "character"
Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de asistencia o ayuda personal`
## [1] "14.07" "10.85" "9.2100000000000009"
## [4] "17.12" "9.1" "10.32"
## [7] "9.49" "9.2100000000000009" "11.12"
## [10] "12.31" "12.14" "7.99"
## [13] "8.1999999999999993" "9.3000000000000007" "9.4"
## [16] "7.39" "12.62" "NA"
## [19] "14.14"
is.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de asistencia o ayuda personal`)
## [1] FALSE
typeof(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de asistencia o ayuda personal`)
## [1] "character"
Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala falta de ambos tipos de ayuda`
## [1] "30.22" "28.37" "34.770000000000003"
## [4] "32.47" "23.29" "28.78"
## [7] "27.47" "35.67" "32.56"
## [10] "26.93" "30.07" "31.88"
## [13] "26.96" "34.6" "18.97"
## [16] "34.479999999999997" "22.51" "NA"
## [19] "29.22"
is.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala falta de ambos tipos de ayuda`)
## [1] FALSE
typeof(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala falta de ambos tipos de ayuda`)
## [1] "character"
Falta_de_ayudas_en_las_personas_con_discapacidad$`No señala falta de ayuda`
## [1] "46.7" "52.98" "48.97" "46.64" "59.64" "55.44" "55.86" "51.39" "43.28"
## [10] "52.51" "49.19" "48.42" "54.09" "40.01" "58.87" "51.39" "58.01" "NA"
## [19] "43.68"
is.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`No señala falta de ayuda`)
## [1] FALSE
typeof(Falta_de_ayudas_en_las_personas_con_discapacidad$`No señala falta de ayuda`)
## [1] "character"
Los datos de todas las columnsa son de tipo “double”.
summary(Falta_de_ayudas_en_las_personas_con_discapacidad, na.rm = TRUE)
## Comunidad Señala solo falta de ayuda técnica
## Length:19 Length:19
## Class :character Class :character
## Mode :character Mode :character
## Señala solo falta de asistencia o ayuda personal
## Length:19
## Class :character
## Mode :character
## Señala falta de ambos tipos de ayuda No señala falta de ayuda
## Length:19 Length:19
## Class :character Class :character
## Mode :character Mode :character
Media_FaltaAyudaTecnica <- mean(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de ayuda técnica`), na.rm=TRUE)
## Warning in
## mean(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo
## falta de ayuda técnica`), : NAs introducidos por coerción
Media_FaltaAyudaTecnicaPersonal <- mean(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de asistencia o ayuda personal`), na.rm=TRUE)
## Warning in
## mean(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo
## falta de asistencia o ayuda personal`), : NAs introducidos por coerción
Media_FaltaAmbos <- mean(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala falta de ambos tipos de ayuda`), na.rm=TRUE)
## Warning in
## mean(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala falta de
## ambos tipos de ayuda`), : NAs introducidos por coerción
Media_NoFaltaAyudas <- mean(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`No señala falta de ayuda`), na.rm=TRUE)
## Warning in mean(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`No
## señala falta de ayuda`), : NAs introducidos por coerción
Medias <- c(Media_FaltaAyudaTecnica, Media_FaltaAyudaTecnicaPersonal, Media_FaltaAmbos, Media_NoFaltaAyudas)
max(Medias, na.rm=TRUE)
## [1] 50.94833
Calculando la media de los valores de todas las comunidades según el tipo de ayudas que reciben, hemos obtenido un valor de 50.94
summary(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala solo falta de ayuda técnica`, na.rm = TRUE)
## Length Class Mode
## 19 character character
Falta_de_ayudas_en_las_personas_con_discapacidad$`Comunidad`[as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala solo falta de ayuda técnica`)== min(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala solo falta de ayuda técnica`), na.rm = TRUE)]
## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
## [1] "Castilla - La Mancha" NA
Falta_de_ayudas_en_las_personas_con_discapacidad$`Comunidad`[as.double (Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de ayuda técnica`) == max(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala solo falta de ayuda técnica`), na.rm = TRUE)]
## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
## [1] "Murcia, Región de" NA
library(tidyverse)
ggplot(data = Falta_de_ayudas_en_las_personas_con_discapacidad, aes(x = `Comunidad`, y = `Señala solo falta de ayuda técnica`)) + geom_bar(stat="identity", position="stack", fill="pink") + ggtitle("Señala solo falta de ayuda técnica") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a falta de ayudas en los casos que solo falta de ayuda técnica Castilla la Mancha presenta el índice más bajo, mientras que la Región de Murcia es la que tiene mayor proporción. Observando el gráfico también es bastante clara lo dispares que son los resultados según la comunidad en la que nos centremos. En dicha gráfica se ve que la falta de ayudas técnicas practicamente no se parece entre ninguna de las comunidades, destacando los dos extremos, siendo los máximos y mínimos indicados anteriormente.
summary(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala solo falta de asistencia o ayuda personal`, na.rm = TRUE)
## Length Class Mode
## 19 character character
Falta_de_ayudas_en_las_personas_con_discapacidad$`Comunidad`[as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala solo falta de asistencia o ayuda personal`)== min(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala solo falta de asistencia o ayuda personal`), na.rm = TRUE)]
## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
## [1] "País Vasco" NA
Falta_de_ayudas_en_las_personas_con_discapacidad$`Comunidad`[as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de asistencia o ayuda personal`) == max(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala solo falta de asistencia o ayuda personal`), na.rm = TRUE)]
## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
## [1] "Balears, Illes" NA
library(tidyverse)
ggplot(data = Falta_de_ayudas_en_las_personas_con_discapacidad, aes(x = `Comunidad`, y = `Señala solo falta de asistencia o ayuda personal`)) + geom_bar(stat="identity", position="stack", fill="green") + ggtitle("Señala solo falta de asistencia o ayuda personal") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a la falta de asistencia o ayuda personal el País Vasco presenta el índice más bajo, mientras que Illes Baleares es la que tiene mayor proporción. Y volvemos a ver en la g´rafica lo dispares qeu pueden llegar a ser las cifras de falta de ayudas según la comunidad.
print(Media_FaltaAyudaTecnica > Media_FaltaAyudaTecnicaPersonal)
## [1] FALSE
Además cabe mencionar que de forma generales los discapacitados presentan más necesidades asistenciales o personales que de ayuda ténica.
summary(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`, na.rm = TRUE)
## Length Class Mode
## 19 character character
Falta_de_ayudas_en_las_personas_con_discapacidad$`Comunidad`[as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`)== min(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`), na.rm = TRUE)]
## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
## [1] "Navarra, Comunidad Foral de" NA
Falta_de_ayudas_en_las_personas_con_discapacidad$`Comunidad`[as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`) == max(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`), na.rm = TRUE)]
## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
## [1] "Castilla - La Mancha" NA
library(tidyverse)
ggplot(data = Falta_de_ayudas_en_las_personas_con_discapacidad, aes(x = `Comunidad`, y = `Señala falta de ambos tipos de ayuda`)) + geom_bar(stat="identity", position="stack", fill="blue") + ggtitle("Señala falta de ambos tipos de ayuda") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a Señala falta de ambos tipos de ayuda la Comunidad Foral de Navarra presenta el índice más bajo, mientras que Castilla la Mancha es la que tiene mayor proporción. Resulta sorprendente ver como Castilla la Mancha presentaba el índice de ayudas técnicas más bajo, mientras que tienen la mayor proporción de la necesidad de ambos tipos de ayuda. Nos imaginamos que esto refleja que el sistema sanitario de Castilla la Mancha tiene un problema con respecto a las ayudas asistenciales que ofrece a los discapacitados.
summary(Falta_de_ayudas_en_las_personas_con_discapacidad $` Actividades formativas `, na.rm = TRUE)
## Warning: Unknown or uninitialised column: ` Actividades formativas `.
## Length Class Mode
## 0 NULL NULL
Falta_de_ayudas_en_las_personas_con_discapacidad$`Comunidad`[as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`)== min(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $` Actividades formativas `), na.rm = TRUE)]
## Warning: NAs introducidos por coerción
## Warning: Unknown or uninitialised column: ` Actividades formativas `.
## Warning in min(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`
## Actividades formativas `), : ningún argumento finito para min; retornando Inf
## [1] NA
Falta_de_ayudas_en_las_personas_con_discapacidad$`Comunidad`[as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`) == max(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`), na.rm = TRUE)]
## Warning: NAs introducidos por coerción
## Warning: NAs introducidos por coerción
## [1] "Canarias" NA
library(tidyverse)
ggplot(data = Falta_de_ayudas_en_las_personas_con_discapacidad, aes(x = `Comunidad`, y = `No señala falta de ayuda`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("No señala falta de ayuda") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Con respecto a las comunidades No señala falta de ayuda NA presenta el índice más bajo, mientras que Canarias es la que tiene mayor proporción.
Análisis estadístico por columnas
summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`), na.rm = TRUE)
## Warning in
## summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala falta
## de ambos tipos de ayuda`), : NAs introducidos por coerción
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 18.97 27.09 29.64 29.40 32.54 35.67 1
summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`), na.rm = TRUE)
## Warning in
## summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`No señala
## falta de ayuda`), : NAs introducidos por coerción
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 40.01 47.13 51.39 50.95 55.10 59.64 1
Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`[ Falta_de_ayudas_en_las_personas_con_discapacidad $`Comunidad`== "Castilla y León"]
## [1] "27.47"
Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`[ Falta_de_ayudas_en_las_personas_con_discapacidad $`Comunidad`== "Castilla y León"]
## [1] "55.86"
Primero vamos a analizar las ayudas en las zonas rurales. Por un lado Castilla y León presenta una falta de ayudas en general inferior a la media, lo que conlleva que la calidad del sistema sanitario es aceptable. Sin embargo, también muestra una cifra inferior a la media para el atributo de que no señala falta de ayudas. Eso quiere decir que las asistencia sanitaria también presenta deficiencias, probablemente, porque Castilla y León tiene muchos centro sanitarios al tener, con diferencia, la mayor cantidad de pueblos y es díficil tener todos correctamente preparados para tratar cualquier tipo de patología.
summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`), na.rm = TRUE)
## Warning in
## summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala falta
## de ambos tipos de ayuda`), : NAs introducidos por coerción
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 18.97 27.09 29.64 29.40 32.54 35.67 1
summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`), na.rm = TRUE)
## Warning in
## summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`No señala
## falta de ayuda`), : NAs introducidos por coerción
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 40.01 47.13 51.39 50.95 55.10 59.64 1
Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`[ Falta_de_ayudas_en_las_personas_con_discapacidad $`Comunidad`== "Aragón"]
## [1] "28.37"
Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`[ Falta_de_ayudas_en_las_personas_con_discapacidad $`Comunidad`== "Aragón"]
## [1] "52.98"
Aragón es la otra comunidad característica de las zonas rurales. Tiene un índice de necesidad de ayudas algo inferior a la media, y, la falta de ayudas, es supeior al valor medio. Eso señala una deficiencia significativa en sistema sanitario aragonés.
summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`), na.rm = TRUE)
## Warning in
## summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala falta
## de ambos tipos de ayuda`), : NAs introducidos por coerción
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 18.97 27.09 29.64 29.40 32.54 35.67 1
summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`), na.rm = TRUE)
## Warning in
## summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`No señala
## falta de ayuda`), : NAs introducidos por coerción
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 40.01 47.13 51.39 50.95 55.10 59.64 1
Barreras_en_la_participación_social $`Señala falta de ambos tipos de ayuda`[ Falta_de_ayudas_en_las_personas_con_discapacidad $`Comunidad`== "Murcia, Región de"]
## Warning: Unknown or uninitialised column: `Señala falta de ambos tipos de
## ayuda`.
## NULL
Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`[ Falta_de_ayudas_en_las_personas_con_discapacidad $`Comunidad`== "Murcia, Región de"]
## [1] "40.01"
Por otro lado, vamos a analizar que ocurre en las zonas urbanas. Murcia presenta una falta de ayudas en general muy superior a la media, y su índice representativo de que no señalan falta de ayudas en inferior a la media. Ambos argumentos refuerzan la idea de que Murcia es una de las comunidades con peor calidad sanitaria, tiene muchas carencias y eso se refleja en necesidades no satisfechas de los discapacitados.
summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`), na.rm = TRUE)
## Warning in
## summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`Señala falta
## de ambos tipos de ayuda`), : NAs introducidos por coerción
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 18.97 27.09 29.64 29.40 32.54 35.67 1
summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`), na.rm = TRUE)
## Warning in
## summary(as.double(Falta_de_ayudas_en_las_personas_con_discapacidad$`No señala
## falta de ayuda`), : NAs introducidos por coerción
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 40.01 47.13 51.39 50.95 55.10 59.64 1
Falta_de_ayudas_en_las_personas_con_discapacidad $`Señala falta de ambos tipos de ayuda`[ Falta_de_ayudas_en_las_personas_con_discapacidad $`Comunidad`== "Madrid, Comunidad de"]
## [1] "26.96"
Falta_de_ayudas_en_las_personas_con_discapacidad $`No señala falta de ayuda`[ Falta_de_ayudas_en_las_personas_con_discapacidad $`Comunidad`== "Madrid, Comunidad de"]
## [1] "54.09"
Madrid deciamos que es la comunidad más representativas de la zona urbana. Con respecto a la falta de ayudas, la proporción es bastante inferior a la media. Y, sobre la no falta de ayudas, los madrileños indican una proporción por encima de la media.
En primer lugar cabe mencionar que el caso de Murcia no es muy representativo porque, como hemos descubierto, su sistema sanitario es uno de los más deficitarios; así que nos fijaremos en Madrid para describir la zona urbana.
En general, las comunidades rurales presentan mayor índice de falta de ayudas a nivel general. Esto se debe a que tienen más centro sanitarios para cubrir el servicio en todos los municipios, pero no están tan bien preparados como los hospitales de las ciudades. Aún así, es relevante ver como ambos tipos de comunidades tienen una proporción de no necesidad de ayudas similar, osea que la satrisfacción de los individuos con su sistema sanitario es similar. Ampliaremos más esta idea en las conclusiones finales del trabajo. Y, una vez más, queremos remarcar que la falta de ayudas está muy relacionada con el nivel económico de la comunidad, Navarra es la que más ayudas ofrece a sus habitantes.
library(readxl)
Discriminacion <- read_excel("DATA/Discriminacion.xlsx")
View(Discriminacion)
Vamos a analizar las dimensiones de este set de datos.
dim(Discriminacion)
## [1] 19 4
Las dimensiones de este set de datos es de 19 files y 4 columnas. 19 filas correspondientes a las 17 ciudades autónomas y las dos ciudades autónomas que componen España. 4 columnas, una perteneciente a las comuninadades, otra al sexo masculina, otra al femenino y una última perteneciente a ambos sexos.
class(Discriminacion)
## [1] "tbl_df" "tbl" "data.frame"
Para poder realizar el análisis de los datos vamos a transformar todos los nombres de las columnas con “make.names” para cumplan las reglas sintácticas. Vamos a realizar este proceso para las columnas “AMBOS_SEXOS”, “HOMBRES”, y “MUJERES”.
make.names(Discriminacion)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.9.94..10.15..9.56..11.94..14.02..10.82..11.07..14.74..14.55..12.65..10.88..9.19..13.93..13.99..12.23..9.77..16.64..12.99..15.69."
## [3] "c.7.56..5.83..8.74..12.88..9.5..9.21..8.83..11.81..11.95..12.75..8.99..6.02..11.17..10.61..7.38..8.79..13.92..2.34..15.51."
## [4] "c.12.23..14.38..10.3..11.01..18.45..12.35..13.25..17.71..17.03..12.55..12.73..12.11..16.43..17.37..17..10.69..19.3..23.5..15.9."
Discriminacion$AMBOS_SEXOS
## [1] 9.94 10.15 9.56 11.94 14.02 10.82 11.07 14.74 14.55 12.65 10.88 9.19
## [13] 13.93 13.99 12.23 9.77 16.64 12.99 15.69
is.double(Discriminacion$AMBOS_SEXOS)
## [1] TRUE
typeof(Discriminacion$AMBOS_SEXOS)
## [1] "double"
make.names(Discriminacion)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.9.94..10.15..9.56..11.94..14.02..10.82..11.07..14.74..14.55..12.65..10.88..9.19..13.93..13.99..12.23..9.77..16.64..12.99..15.69."
## [3] "c.7.56..5.83..8.74..12.88..9.5..9.21..8.83..11.81..11.95..12.75..8.99..6.02..11.17..10.61..7.38..8.79..13.92..2.34..15.51."
## [4] "c.12.23..14.38..10.3..11.01..18.45..12.35..13.25..17.71..17.03..12.55..12.73..12.11..16.43..17.37..17..10.69..19.3..23.5..15.9."
Discriminacion$HOMBRES
## [1] 7.56 5.83 8.74 12.88 9.50 9.21 8.83 11.81 11.95 12.75 8.99 6.02
## [13] 11.17 10.61 7.38 8.79 13.92 2.34 15.51
is.double(Discriminacion$HOMBRES)
## [1] TRUE
typeof(Discriminacion$HOMBRES)
## [1] "double"
make.names(Discriminacion)
## [1] "c..Andalucía....Aragón....Asturias..Principado.de....Balears..Illes....Canarias....Cantabria....Castilla.y.León....Castilla...La.Mancha....Cataluña....Comunitat.Valenciana....Extremadura....Galicia....Madrid..Comunidad.de....Murcia..Región.de....Navarra..Comunidad.Foral.de....País.Vasco....Rioja..La....Ceuta....Melilla.."
## [2] "c.9.94..10.15..9.56..11.94..14.02..10.82..11.07..14.74..14.55..12.65..10.88..9.19..13.93..13.99..12.23..9.77..16.64..12.99..15.69."
## [3] "c.7.56..5.83..8.74..12.88..9.5..9.21..8.83..11.81..11.95..12.75..8.99..6.02..11.17..10.61..7.38..8.79..13.92..2.34..15.51."
## [4] "c.12.23..14.38..10.3..11.01..18.45..12.35..13.25..17.71..17.03..12.55..12.73..12.11..16.43..17.37..17..10.69..19.3..23.5..15.9."
Discriminacion$MUJERES
## [1] 12.23 14.38 10.30 11.01 18.45 12.35 13.25 17.71 17.03 12.55 12.73 12.11
## [13] 16.43 17.37 17.00 10.69 19.30 23.50 15.90
is.double(Discriminacion$MUJERES)
## [1] TRUE
typeof(Discriminacion$MUJERES)
## [1] "double"
Vamos a ir analizando cada columna
Columna “AMBOS_SEXOS”"
Media y mediana
mean(as.double(Discriminacion$AMBOS_SEXOS), na.rm = TRUE)
## [1] 12.35526
La media del número de discriminación en ambos sexos por comunidad y/o ciudad autónoma es 12.35526
median(as.double(Discriminacion$AMBOS_SEXOS), na.rm = TRUE)
## [1] 12.23
La medina del número de discriminación en ambos sexos por comunidad y/o ciudad autónoma es 12.23
La mediana de los datos demográficos no se distancia mucho de la media, por lo que no debería de haber datos muy extremos.
summary(as.double(Discriminacion$AMBOS_SEXOS), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 9.19 10.48 12.23 12.36 14.01 16.64
El mínimo es: 9.19
El máximo es: 16.64
El primer cuartil es: 10.48
El tercer cuartil es: 14.01
La mediana: 12.23
La media es: 12.36
El mínimo corresponde a la comunidad de Galicia, esto puede deberse a que esta comunidad también presenta buenas tasas en datos como las necesidades no satisfechas y esta dentro de las comunidades con mayor satisfacion por parte de sus ciudadanos. El sentimiento de discriminación es influencia en parte por las necesidades satisfechas o no de los pacientes, por lo tanto, tiene sentido que a menor tasa de necesidades no satisfechas menor tasa de discriminación.
El máximo corresponde a la comunidad La Rioja.
Columna “HOMBRES”"
Media y mediana
mean(as.double(Discriminacion$HOMBRES), na.rm = TRUE)
## [1] 9.673158
La media del número total de discriminación en hombres por comunidad y/o ciudad autónoma es 9.673158
median(as.double(Discriminacion$HOMBRES), na.rm = TRUE)
## [1] 9.21
La medina del número de discrimanción en hombres por comunidad y/o ciudad autónoma es 9.21
La mediana de los datos demográficos no se distancia mucho de la media, por lo que no debería de haber datos muy extremos.
summary(as.double(Discriminacion$HOMBRES), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.340 8.150 9.210 9.673 11.880 15.510
El mínimo es: 2.34
El máximo es: 15.51
El primer cuartil es: 8.150
El tercer cuartil es: 11.88
La mediana: 9.21
La media es: 9.673
El mínimo corresponde a la ciudad de Ceuta. El máximo corresponde a la ciudad de Melilla.
Columna “MUJERES”"
Media y mediana
mean(as.double(Discriminacion$MUJERES), na.rm = TRUE)
## [1] 14.96263
La media del número de discriminación en mujeres por comunidad y/o ciudad autónoma es 14.96263
median(as.double(Discriminacion$MUJERES), na.rm = TRUE)
## [1] 14.38
La mediana del número de discriminación en mujeres por comunidad y/o ciudad autónoma es 14.38
La mediana de los datos demográficos no se distancia mucho de la media, por lo que no debería de haber datos muy extremos.
Cálculo conjunto de varias medidas estadísticas (summary)
summary(as.double(Discriminacion$MUJERES), na.rm = TRUE)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 10.30 12.29 14.38 14.96 17.20 23.50
El mínimo es: 10.3
El máximo es: 23.5
El primer cuartil es: 12.29
El tercer cuartil es: 17.2
La mediana: 14.38
La media es: 14.96
El mínimo corresponde a la comunidad de Asturias en esto puede influir que Asturias tiene el menor dato demográfico. El máximo corresponde a la ciudad de Ceuta.Esta ciudad encabeza limitaciones para ocuparse de los trámites administrativos diarios, con mayor insatisfación con el entorno. Este dato choca bastante con que en el análisis anterior hemos comprado que la ciudad/comunidad autónoma con menor indice de discapacidad en hombres es Ceuta esto puede deberse a la discriminación por sexo que sufren las mujeres y no los hombres.
Gráfico discriminación en ambos sexos
library(tidyverse)
ggplot(data = Discriminacion, aes(x = `Comunidad`, y = `AMBOS_SEXOS`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("Discriminación ambos sexos") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Gráfico discriminación en hombres
library(tidyverse)
ggplot(data = Discriminacion, aes(x = `Comunidad`, y = `HOMBRES`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("Discriminación en hombres") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Gráfico discriminación en mujeres
library(tidyverse)
ggplot(data = Discriminacion, aes(x = `Comunidad`, y = `MUJERES`)) + geom_bar(stat="identity", position="stack", fill="red") + ggtitle("Discriminación en mujeres") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
A continuación vamos a ver una imagen donde se muestra el índice de satisfacción con el entorno de los europeas. En España se aprecia la clara diferencia entre en norte y el sur. Pero debemos señalar que el en líneas generales los españoles están más conformes con su calidad de vida que el resto de europeos, no hay ninguna comunidad excasivamente desfavorecida.
Unión entre tabla de los tipos de discapacidad (discapacidad severa) y economia de los discapacitados
Select_Discapacidad_y_Autonomia_personal <- Discapacidad_y_Autonomia_personal %>%
select(`Comunidad`, `Tasa de discapacidad severa`) %>%
mutate(`Porcentaje tasa discapacidad severa`= `Tasa de discapacidad severa`*100)
Select_Discapacidad_y_Autonomia_personal <- Select_Discapacidad_y_Autonomia_personal %>%
select(`Comunidad`, `Porcentaje tasa discapacidad severa`)
Select_Discapacidad_y_Autonomia_personal
## # A tibble: 19 x 2
## Comunidad `Porcentaje tasa discapacidad severa`
## <chr> <dbl>
## 1 Andalucía 4.82
## 2 Aragón 4.15
## 3 Asturias, Principado de 3.65
## 4 Balears, Illes 6.25
## 5 Canarias 4.78
## 6 Cantabria 4.49
## 7 Castilla y León 3.33
## 8 Castilla - La Mancha 3.51
## 9 Cataluña 4.77
## 10 Comunitat Valenciana 5.53
## 11 Extremadura 4.37
## 12 Galicia 5.52
## 13 Madrid, Comunidad de 1.94
## 14 Murcia, Región de 3.76
## 15 Navarra, Comunidad Foral de 3.24
## 16 País Vasco 3.73
## 17 Rioja, La 3.05
## 18 Ceuta 6.54
## 19 Melilla 6.84
Select_Economia_discapacitados <- Economia_discapacitados %>%
select(`Comunidad`, `Con dificultades para pagar las cosas esenciales`)
Select_Economia_discapacitados
## # A tibble: 19 x 2
## Comunidad `Con dificultades para pagar las cosas esenciale~
## <chr> <dbl>
## 1 Andalucía 52.9
## 2 Aragón 30.2
## 3 Asturias, Principado de 37.9
## 4 Balears, Illes 41.9
## 5 Canarias 48.7
## 6 Cantabria 39.9
## 7 Castilla y León 35.1
## 8 Castilla - La Mancha 44.2
## 9 Cataluña 41.4
## 10 Comunitat Valenciana 45.8
## 11 Extremadura 42.3
## 12 Galicia 42.4
## 13 Madrid, Comunidad de 42.4
## 14 Murcia, Región de 48.0
## 15 Navarra, Comunidad Foral de 28.5
## 16 País Vasco 26.4
## 17 Rioja, La 35.4
## 18 Ceuta 41.5
## 19 Melilla 37.9
Relacion_gravedad_economia <- full_join(x = Select_Discapacidad_y_Autonomia_personal, y = Select_Economia_discapacitados, by = "Comunidad")
Relacion_gravedad_economia
## # A tibble: 19 x 3
## Comunidad `Porcentaje tasa disca~ `Con dificultades para p~
## <chr> <dbl> <dbl>
## 1 Andalucía 4.82 52.9
## 2 Aragón 4.15 30.2
## 3 Asturias, Principado de 3.65 37.9
## 4 Balears, Illes 6.25 41.9
## 5 Canarias 4.78 48.7
## 6 Cantabria 4.49 39.9
## 7 Castilla y León 3.33 35.1
## 8 Castilla - La Mancha 3.51 44.2
## 9 Cataluña 4.77 41.4
## 10 Comunitat Valenciana 5.53 45.8
## 11 Extremadura 4.37 42.3
## 12 Galicia 5.52 42.4
## 13 Madrid, Comunidad de 1.94 42.4
## 14 Murcia, Región de 3.76 48.0
## 15 Navarra, Comunidad Foral de 3.24 28.5
## 16 País Vasco 3.73 26.4
## 17 Rioja, La 3.05 35.4
## 18 Ceuta 6.54 41.5
## 19 Melilla 6.84 37.9
Pivot_gravedad_economia <- pivot_longer(data = Relacion_gravedad_economia, names_to = "Variables", values_to = "Valores", cols = c( `Porcentaje tasa discapacidad severa`:`Con dificultades para pagar las cosas esenciales`))
Pivot_gravedad_economia
## # A tibble: 38 x 3
## Comunidad Variables Valores
## <chr> <chr> <dbl>
## 1 Andalucía Porcentaje tasa discapacidad severa 4.82
## 2 Andalucía Con dificultades para pagar las cosas esenci~ 52.9
## 3 Aragón Porcentaje tasa discapacidad severa 4.15
## 4 Aragón Con dificultades para pagar las cosas esenci~ 30.2
## 5 Asturias, Principado de Porcentaje tasa discapacidad severa 3.65
## 6 Asturias, Principado de Con dificultades para pagar las cosas esenci~ 37.9
## 7 Balears, Illes Porcentaje tasa discapacidad severa 6.25
## 8 Balears, Illes Con dificultades para pagar las cosas esenci~ 41.9
## 9 Canarias Porcentaje tasa discapacidad severa 4.78
## 10 Canarias Con dificultades para pagar las cosas esenci~ 48.7
## # ... with 28 more rows
ggplot(data = Pivot_gravedad_economia, aes(x = `Comunidad`, y = `Valores`)) + geom_bar(stat="identity", position="stack", aes(fill = factor(Variables))) + ggtitle("Relación gravedad discapacidad y economía del discapacitado") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Nosotras pensamos que no solo es competencia de los amigos y familiares empatizar con una persona discapcitada y dedicarla tiempo, sino que la sociedad en su conjunto debe favorecer a que puedan hacer planes tranquilos que cualquier realizamos a diario como ir a tomar un café.
También nos gustaría reseñar que los discapacitados muchas veces padecen trastornos psicológicos como consecuencia de su situación, al ver transformada toda su vida. Todos deberíamos esforzarnos por crear una sociedad donde no se sientan desplazados, y rebajar así la incidencia de patologías como la depresión.
Unión entre limitaciones cotidianas y discriminación social
Select_Limitaciones_domesticas <- Limitaciones_vida_cotidiana %>%
select(`Comunidad`, `Para realizar tareas domésticas`)
Select_Limitaciones_domesticas
## # A tibble: 19 x 2
## Comunidad `Para realizar tareas domésticas`
## <chr> <dbl>
## 1 Andalucía 5.91
## 2 Aragón 6.93
## 3 Asturias, Principado de 4.96
## 4 Balears, Illes 3.01
## 5 Canarias 6.11
## 6 Cantabria 5.84
## 7 Castilla y León 5.02
## 8 Castilla - La Mancha 7.03
## 9 Cataluña 6.17
## 10 Comunitat Valenciana 5.83
## 11 Extremadura 4.6
## 12 Galicia 7.1
## 13 Madrid, Comunidad de 4.66
## 14 Murcia, Región de 6.86
## 15 Navarra, Comunidad Foral de 4.11
## 16 País Vasco 5.89
## 17 Rioja, La 5.83
## 18 Ceuta 6.38
## 19 Melilla 5.55
Select_Discriminacion <- Discriminacion %>%
select(`Comunidad`, `AMBOS_SEXOS`)
Select_Discriminacion
## # A tibble: 19 x 2
## Comunidad AMBOS_SEXOS
## <chr> <dbl>
## 1 Andalucía 9.94
## 2 Aragón 10.2
## 3 Asturias, Principado de 9.56
## 4 Balears, Illes 11.9
## 5 Canarias 14.0
## 6 Cantabria 10.8
## 7 Castilla y León 11.1
## 8 Castilla - La Mancha 14.7
## 9 Cataluña 14.6
## 10 Comunitat Valenciana 12.6
## 11 Extremadura 10.9
## 12 Galicia 9.19
## 13 Madrid, Comunidad de 13.9
## 14 Murcia, Región de 14.0
## 15 Navarra, Comunidad Foral de 12.2
## 16 País Vasco 9.77
## 17 Rioja, La 16.6
## 18 Ceuta 13.0
## 19 Melilla 15.7
Relacion_limitacion_discriminacion <- full_join(x = Select_Limitaciones_domesticas, y = Select_Discriminacion, by = "Comunidad")
Relacion_limitacion_discriminacion
## # A tibble: 19 x 3
## Comunidad `Para realizar tareas domésticas` AMBOS_SEXOS
## <chr> <dbl> <dbl>
## 1 Andalucía 5.91 9.94
## 2 Aragón 6.93 10.2
## 3 Asturias, Principado de 4.96 9.56
## 4 Balears, Illes 3.01 11.9
## 5 Canarias 6.11 14.0
## 6 Cantabria 5.84 10.8
## 7 Castilla y León 5.02 11.1
## 8 Castilla - La Mancha 7.03 14.7
## 9 Cataluña 6.17 14.6
## 10 Comunitat Valenciana 5.83 12.6
## 11 Extremadura 4.6 10.9
## 12 Galicia 7.1 9.19
## 13 Madrid, Comunidad de 4.66 13.9
## 14 Murcia, Región de 6.86 14.0
## 15 Navarra, Comunidad Foral de 4.11 12.2
## 16 País Vasco 5.89 9.77
## 17 Rioja, La 5.83 16.6
## 18 Ceuta 6.38 13.0
## 19 Melilla 5.55 15.7
Pivot_limitacion_discriminacion <- pivot_longer(data = Relacion_limitacion_discriminacion, names_to = "Variables", values_to = "Valores", cols = c( `Para realizar tareas domésticas`:`AMBOS_SEXOS`))
Pivot_limitacion_discriminacion
## # A tibble: 38 x 3
## Comunidad Variables Valores
## <chr> <chr> <dbl>
## 1 Andalucía Para realizar tareas domésticas 5.91
## 2 Andalucía AMBOS_SEXOS 9.94
## 3 Aragón Para realizar tareas domésticas 6.93
## 4 Aragón AMBOS_SEXOS 10.2
## 5 Asturias, Principado de Para realizar tareas domésticas 4.96
## 6 Asturias, Principado de AMBOS_SEXOS 9.56
## 7 Balears, Illes Para realizar tareas domésticas 3.01
## 8 Balears, Illes AMBOS_SEXOS 11.9
## 9 Canarias Para realizar tareas domésticas 6.11
## 10 Canarias AMBOS_SEXOS 14.0
## # ... with 28 more rows
ggplot(data = Pivot_limitacion_discriminacion, aes(x = `Comunidad`, y = `Valores`)) + geom_bar(stat="identity", position="stack", aes(fill = factor(Variables))) + ggtitle("Relación limitaciones cotidianas y discriminación social") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
Unión entre la tabla que muestra la satisfacción de los inviduos con e entorno donde viven y las necesidades no satisfechas a nivel sanitario de dichos inviduos.
Satisfacción_con_el_entorno <- dplyr::rename(.data = Satisfacción_con_el_entorno, Comunidad = `Total`)
Satisfacción_con_el_entorno
## # A tibble: 19 x 2
## Comunidad Satisfacción
## <chr> <dbl>
## 1 Andalucía 7
## 2 Aragón 7.6
## 3 Asturias, Principado de 7.7
## 4 Balears, Illes 7.6
## 5 Canarias 7.1
## 6 Cantabria 7.6
## 7 Castilla y León 7.4
## 8 Castilla-La Mancha 7.4
## 9 Cataluña 7.2
## 10 Comunitat Valenciana 7.2
## 11 Extremadura 7.3
## 12 Galicia 6.6
## 13 Madrid, Comunidad de 7.1
## 14 Murcia, Región de 7
## 15 Navarra, Comunidad Foral de 7.8
## 16 País Vasco 7.5
## 17 Rioja, La 7.4
## 18 Ceuta 6.3
## 19 Melilla 6.8
Necesidades_no_satisfechas <- dplyr::rename(.data = Necesidades_no_satisfechas, Comunidad = `Comunidades`)
Necesidades_no_satisfechas
## # A tibble: 19 x 2
## Comunidad Necesidades
## <chr> <dbl>
## 1 Andalucía 0.5
## 2 Aragón 0
## 3 Asturias, Principado de 0.2
## 4 Balears, Illes 0.6
## 5 Canarias 1.4
## 6 Cantabria 0
## 7 Castilla y León 0.3
## 8 Castilla - La Mancha 0.5
## 9 Cataluña 0.3
## 10 Comunitat Valenciana 0.8
## 11 Extremadura 0.1
## 12 Galicia 0
## 13 Madrid, Comunidad de 0.4
## 14 Murcia, Región de 0.2
## 15 Navarra, Comunidad Foral de 0.9
## 16 País Vasco 0.1
## 17 Rioja, La 0.1
## 18 Ceuta 0
## 19 Melilla 0
Relacion_satisfaccion_necesidades <- full_join(x = Satisfacción_con_el_entorno, y = Necesidades_no_satisfechas, by = "Comunidad")
Relacion_satisfaccion_necesidades
## # A tibble: 20 x 3
## Comunidad Satisfacción Necesidades
## <chr> <dbl> <dbl>
## 1 Andalucía 7 0.5
## 2 Aragón 7.6 0
## 3 Asturias, Principado de 7.7 0.2
## 4 Balears, Illes 7.6 0.6
## 5 Canarias 7.1 1.4
## 6 Cantabria 7.6 0
## 7 Castilla y León 7.4 0.3
## 8 Castilla-La Mancha 7.4 NA
## 9 Cataluña 7.2 0.3
## 10 Comunitat Valenciana 7.2 0.8
## 11 Extremadura 7.3 0.1
## 12 Galicia 6.6 0
## 13 Madrid, Comunidad de 7.1 0.4
## 14 Murcia, Región de 7 0.2
## 15 Navarra, Comunidad Foral de 7.8 0.9
## 16 País Vasco 7.5 0.1
## 17 Rioja, La 7.4 0.1
## 18 Ceuta 6.3 0
## 19 Melilla 6.8 0
## 20 Castilla - La Mancha NA 0.5
Pivot_satisfaccion_necesidades <- pivot_longer(data = Relacion_satisfaccion_necesidades, names_to = "Variables", values_to = "Valores", cols = c( `Satisfacción`:`Necesidades`))
Pivot_satisfaccion_necesidades
## # A tibble: 40 x 3
## Comunidad Variables Valores
## <chr> <chr> <dbl>
## 1 Andalucía Satisfacción 7
## 2 Andalucía Necesidades 0.5
## 3 Aragón Satisfacción 7.6
## 4 Aragón Necesidades 0
## 5 Asturias, Principado de Satisfacción 7.7
## 6 Asturias, Principado de Necesidades 0.2
## 7 Balears, Illes Satisfacción 7.6
## 8 Balears, Illes Necesidades 0.6
## 9 Canarias Satisfacción 7.1
## 10 Canarias Necesidades 1.4
## # ... with 30 more rows
ggplot(data = Pivot_satisfaccion_necesidades, aes(x = `Comunidad`, y = `Valores`)) + geom_bar(stat="identity", position="stack", aes(fill = factor(Variables))) + ggtitle("Relación entre la satisfacción de los habitantes y sus necesidades no satisfechas") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
## Warning: Removed 2 rows containing missing values (position_stack).
De hecho podríamos inferir que las comunidades con pacientes más graves son las que presentan más discapacitados viviendo en el hogar de sus cuidadores, y además estas suelen ser las comunidades menos favorecidas económicamente.
Unión entre la tabla que muestra los problemas económicos de los discapacitados y los que habitan en la casa de sus cuidadores.
Select_Economia <- Economia_discapacitados %>%
select(`Comunidad`, `Con dificultades para pagar las cosas esenciales`)
Select_Economia
## # A tibble: 19 x 2
## Comunidad `Con dificultades para pagar las cosas esenciale~
## <chr> <dbl>
## 1 Andalucía 52.9
## 2 Aragón 30.2
## 3 Asturias, Principado de 37.9
## 4 Balears, Illes 41.9
## 5 Canarias 48.7
## 6 Cantabria 39.9
## 7 Castilla y León 35.1
## 8 Castilla - La Mancha 44.2
## 9 Cataluña 41.4
## 10 Comunitat Valenciana 45.8
## 11 Extremadura 42.3
## 12 Galicia 42.4
## 13 Madrid, Comunidad de 42.4
## 14 Murcia, Región de 48.0
## 15 Navarra, Comunidad Foral de 28.5
## 16 País Vasco 26.4
## 17 Rioja, La 35.4
## 18 Ceuta 41.5
## 19 Melilla 37.9
Select_Cuidadores <- Cuidadores %>%
select(`Comunidad`, `En el hogar de la persona que cuida`)
Select_Cuidadores
## # A tibble: 20 x 2
## Comunidad `En el hogar de la persona que cuida`
## <chr> <dbl>
## 1 Andalucía 1280.
## 2 Aragón 240.
## 3 Asturias, Principado de 45.1
## 4 Balears, Illes 40.2
## 5 Canarias 22.9
## 6 Cantabria 43
## 7 Castilla y León 18.8
## 8 Castilla - La Mancha 84.6
## 9 Cataluña 61.8
## 10 Comunitat Valenciana 170.
## 11 Extremadura 159.
## 12 Galicia 32.9
## 13 Madrid, Comunidad de 128.
## 14 Murcia, Región de 105.
## 15 Navarra, Comunidad Foral de 40.3
## 16 País Vasco 15
## 17 Rioja, La 61.3
## 18 Ceuta 7.9
## 19 Melilla 2.5
## 20 <NA> 2.6
Relacion_cuidadores_economia <- full_join(x = Select_Economia, y = Select_Cuidadores, by = "Comunidad")
Relacion_cuidadores_economia
## # A tibble: 20 x 3
## Comunidad `Con dificultades para pa~ `En el hogar de la pe~
## <chr> <dbl> <dbl>
## 1 Andalucía 52.9 1280.
## 2 Aragón 30.2 240.
## 3 Asturias, Principado de 37.9 45.1
## 4 Balears, Illes 41.9 40.2
## 5 Canarias 48.7 22.9
## 6 Cantabria 39.9 43
## 7 Castilla y León 35.1 18.8
## 8 Castilla - La Mancha 44.2 84.6
## 9 Cataluña 41.4 61.8
## 10 Comunitat Valenciana 45.8 170.
## 11 Extremadura 42.3 159.
## 12 Galicia 42.4 32.9
## 13 Madrid, Comunidad de 42.4 128.
## 14 Murcia, Región de 48.0 105.
## 15 Navarra, Comunidad Foral de 28.5 40.3
## 16 País Vasco 26.4 15
## 17 Rioja, La 35.4 61.3
## 18 Ceuta 41.5 7.9
## 19 Melilla 37.9 2.5
## 20 <NA> NA 2.6
Pivot_cuidadores_economia <- pivot_longer(data = Relacion_cuidadores_economia, names_to = "Variables", values_to = "Valores", cols = c( `Con dificultades para pagar las cosas esenciales`:`En el hogar de la persona que cuida`))
Pivot_cuidadores_economia
## # A tibble: 40 x 3
## Comunidad Variables Valores
## <chr> <chr> <dbl>
## 1 Andalucía Con dificultades para pagar las cosas esenci~ 52.9
## 2 Andalucía En el hogar de la persona que cuida 1280.
## 3 Aragón Con dificultades para pagar las cosas esenci~ 30.2
## 4 Aragón En el hogar de la persona que cuida 240.
## 5 Asturias, Principado de Con dificultades para pagar las cosas esenci~ 37.9
## 6 Asturias, Principado de En el hogar de la persona que cuida 45.1
## 7 Balears, Illes Con dificultades para pagar las cosas esenci~ 41.9
## 8 Balears, Illes En el hogar de la persona que cuida 40.2
## 9 Canarias Con dificultades para pagar las cosas esenci~ 48.7
## 10 Canarias En el hogar de la persona que cuida 22.9
## # ... with 30 more rows
ggplot(data = Pivot_cuidadores_economia, aes(x = `Comunidad`, y = `Valores`)) + geom_bar(stat="identity", position="stack", aes(fill = factor(Variables))) + ggtitle("Relación los cuidadores y las dificultades económicas de los discapacitados") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))
## Warning: Removed 1 rows containing missing values (position_stack).
En primer lugar, parece ser que el entorno no tiene una gran implicación sobre la aparición de discapacidades.
Por otro lado, no vemos una diferencia clara entre la calidad del sistema sanitario de las comunidades más rurales y las más urbanas. Las comunidades con más cantidad de pueblos (Castilla y León) presentan mayor cantidad de consultorios pero esto no implica que sea un sistema sanitario de mejor calidad. De hecho sabemos que muchos consultorios rurales presentan una atención deficitaria porque están muy poco tiempo abiertos debido a las dificultades para sufragar costes tan elevados. Esta información la hemos visto reflejada en el set de datos que trataba sobre la falta de ayudas. De hecho si revisamos las noticias estatales de los últimos días veremos datos como los siguientes:
Pesé a estas situaciones nosotras no hemos apreciado estadísticamente más necesidades no satisfechas en el ámbito rural, así que no vamos a indagar más en el asunto. Solo mencionar que probablemente las personas con discapacidades más graves prefieran vivir en ciudades por la inmediatez de los servicios sanitarios, aunque no dudamos del efecto sanador de la tranquilidad de los pueblos.
Por último, debemos mencionar que nos ha sorprendido la afianzadísima relación que existe entre la economía de una comunidad y la calidad de sus sistema sanitario. Aquellas comunidades con mayor poder adquisitivo son las que mejor asistencia ofrecen a sus habitantes, y eso es un problema para la sociedad. En España no existe diferencias económicas muy grandes, pero estos matices sí que afectan a la satisfacción de los habitantes con su sistema sanitario autonómico. A continuación vamos a adjuntar una imagen donde se muestra el nivel adquisitivo de cada comunidad.